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出 于 安全 、 稳 定 等 因素 的 考虑 ,开源 软件 受到 了 各 行 各 业 的 青睐 ,其 中 
以 Linux 操作 系统 最 为 突出 。 作 为 当前 最 为 流行 的 操作 系统 之 一 一 一 
Linux 已 发 展 得 较为 成 熟 , 其 良好 的 稳定 性 和 优异 的 性 能 带 给 各 类 用 户 优越 
的 体验 。Linux 系统 的 使 用 范围 越 来 越 广 , 随 之 而 来 的 是 Linux 环境 下 各 类 
应 用 软件 需求 的 暴 增 。 学 习 Linux 环境 编程 对 提高 IT 从 业者 的 竞争 力 和 
整个 软件 行业 的 发 展 无 疑 是 相当 有 意义 的 。 

本 书 以 培养 Linux 系统 程序 分 析 能 力 为 目标 ,以 命令 程序 设计 为 驱动 。 
在 解决 问题 的 过 程 中 始终 以 培养 分 析 问 题 的 能 力 为 基础 ,介绍 有 效 使 用 
Linux 在 线 手册 的 方法 ,从 而 找到 解决 问题 的 突破 口 ,进一步 找到 合适 的 系 
统 调 用 接口 ,设计 相关 的 命令 程序 ,最 终 解决 问题 。 

C 语言 是 广大 程序 设计 人 员 都 已 掌握 的 一 门 程序 设计 语言 ,同时 也 是 实 
IL Linux 系统 所 使 用 的 程序 设计 语言 。 本 书 使 用 C 语言 结合 Linux API 3t 
行程 序 设计 ,全 书 共 分 为 10 章 , 内 容 如 下 所 述 : 

第 1 章 Linux 基础 知识 ,介绍 Linux 操作 系统 的 发 展 情况 以 及 系统 编程 
的 概念 ,同时 还 介绍 Linux 系统 中 的 一 些 常 用 工具 及 命令 。 

第 2 章 C 程序 开发 工具 ,介绍 Linux 环境 下 编写 C 语言 程序 所 要 用 到 
的 一 些 工具 ,包括 vim gec, gdb makefile 等 。 

第 3 章 文件 及 目录 管理 ,介绍 POSIX 标准 下 文件 的 各 类 I/O 操作 以 及 
与 流 文件 的 关系 和 相互 转换 。 

第 4 章 进 程 管理 ,介绍 在 Linux 环境 中 程序 和 进程 的 关系 、 进 程 的 基本 
属性 、 一 个 进程 从 生 到 死 的 全 过 程 , 最 后 介绍 Linux 系统 中 的 一 些 特殊 
进程 。 

第 5 章 重 定向 与 管道 ,以 实现 重 定向 命令 为 引入 点 ,重点 介绍 使 用 管道 
实现 进程 间 通 信 的 方法 。 

第 6 章 信号 ,介绍 信号 的 几 种 处 理 策略 和 信号 在 进程 间 通 信 中 的 使 用 方 
3s 

第 7 章 进 程 间 通信 ,介绍 使 用 共享 内 存 、 信 号 量 和 消息 队列 来 实现 进程 
间 通 信 的 方法 ,同时 总 结 Linux 环境 下 进程 间 通 信 的 所 有 机 制 。 

第 8 章 线程 ,介绍 线程 的 基本 概念 和 基本 操作 。 

第 9 章 线程 间 的 同步 机 制 ,介绍 线程 间 的 通信 机 制 以 及 线程 同步 互 斥 的 
问题 。 
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第 10 章 网 络 程序 设计 ,介绍 套 接 字 机 制 在 不 同 主机 的 进程 间 如 何 实现 通信 以 及 在 
Linux 环境 下 网 络 套 接 字 编 程 的 基本 方法 。 

其 中 第 5 一 7 章 以 及 第 10 章 都 是 有 关于 进程 间 通 信 机 制 的 内 容 。 

为 检查 各 章 的 学 习 情 况 , 本 书 最 后 配备 了 相应 的 实验 。 

作为 Linux 环境 程序 设计 的 入 门 教材 ,本 书 语 言 简练 .论述 由 浅 入 深 , 并 辅 以 大 量 的 
示例 程序 和 丰富 的 图 表 , 使 读者 能 够 更 好 地 理解 各 种 抽象 的 概念 和 关系 ,帮助 读者 理解 全 
书 内 容 。 本 书面 向 各 类 高 等 院 校 的 计算 机 相关 专业 学 生 以 及 对 开源 环境 程序 设计 有 兴趣 
的 编程 爱好 者 ,要 求 读者 有 一 定 的 C 语言 编程 基础 。 书 中 除了 讲解 程序 的 设计 实现 之 
外 ,着 重 讲解 解决 问题 的 分 析 过 程 ,力求 使 读者 掌握 问题 的 分 析 方 法 ,逐步 培养 读者 具有 
在 Linux 环境 下 独立 设计 和 实现 应 用 级 甚至 系统 级 程序 的 能 力 。 

需要 说 明 的 一 点 是 ,由 于 系统 调用 从 C 语言 语法 的 角度 上 来 看 与 函数 没有 区 别 , 因 
此 在 本 书 中 不 会 引起 歧义 的 地 方 并 没有 严格 区 分 系统 调用 和 库 函数 的 表述 。 如 果 需 要 明 
确 某 一 表述 是 系统 调用 还 是 库 函 数 , 可 以 使 用 man 手册 查找 。man 手册 的 第 2 章 为 系统 
调用 ,第 3 章 为 库 函 数 。 

本 书 主要 由 黄 茹 主编 ,王小银 \ 张 丽 丽 为 副 主编 。 其 中 黄 茹 编写 了 第 1、4、5、6、7 章 ; 
王小银 编写 了 第 8.9.10 章 ; 张 丽 丽 编写 了 第 2、3 章 ; 最 后 由 黄 茹 负责 对 全 书 进行 了 统 稿 。 
此 外 ,在 本 书 的 编写 过 程 中 ,感谢 陈 莉 君 、 舒 新 峰 、 刘 霞 林 、 王 春 梅 对 本 书 提出 了 宝贵 的 
意见 。 

尽管 本 书 经 过 了 编者 反复 的 修改 ,但 由 于 编者 水 平和 经 验 有 限 , 时 间 仓促 , 书 中 难免 
存在 错漏 之 处 ,殷切 希望 广大 读者 批评 指正 。 


编 者 
2019 年 1 月 
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Linux 是 一 套 免费 .开源 .自由 传播 的 类 UNTX 操作 系统 , 它 遵 循 POSIX 标准 和 GPL 
原则 ,支持 多 用 户 、 多 任务 ,支持 多 线程 和 多 CPU。Linux 操作 系统 能 够 运行 大 部 分 
UNIX 工具 软件 .应 用 程序 和 网 络 协议 ,支持 32 位 和 64 位 硬件 ,是 一 个 性 能 稳定 的 多 用 
户 网 络 操作 系统 。Linux 因 其 强大 功能 和 开源 特性 使 之 成 为 最 有 前 途 的 操作 系统 之 一 。 
本 章 将 带领 读者 进入 Linux 世界 。 


1.1 Linux 简介 


111 Linx 系 统 的 发 展 


1. UNIX 操作 系统 

回顾 Linux 的 诞生 ,不 得 不 提 到 一 个 名 为 MULTICS 的 项 目 。20 世纪 60 年 代 时 ,在 
美国 国防 高 级 研究 计划 署 ARPA 的 支持 下 ,贝尔 实验 室 、 通 用 电器 公司 和 麻 省 理工 学 院 
计划 合作 开发 一 个 多 用 途 、 分 时 和 多 用 户 的 操作 系统 ,该 项 目 名 为 MULTICS, 即 
Multiplexed Information and Computing Service。 人 们 希望 该 操作 系统 能 够 同时 支持 整 
个 波士顿 所 有 的 分 时 用 户 。 不 过 ,由 于 这 个 项 目 太 过 复杂 ,整个 目标 过 于 庞大 ,加 入 了 太 
多 的 特性 ,导致 开发 进展 缓慢 。 于 是 到 了 1969 4E 2 月 ,贝尔 实验 室 决定 退出 这 个 项 目 。 

尽管 MULTICS 项 目 并 未 成 功 , 但 是 它 的 出 现 引 入 了 现代 操作 系统 领域 的 许多 概念 
雏形 ,对 随后 的 操作 系统 特别 是 UNIX 的 成 功 有 着 巨大 的 影响 。 

在 贝尔 实验 室 还 未 退出 MULTICS 项 目 时 ,有 一 个 名 为 Ken Thompson 的 工程 师 ， 
他 在 工作 之 余 编 写 了 一 个 名 为 Space Travel 的 游戏 以 供 娱乐 ,然而 ,这 个 游戏 软件 在 
GE-635 机 器 上 运行 的 情况 不 尽 如 人 意 , 反 应 非常 慢 , 直 到 Ken Thompson 发 现 了 一 部 被 
闲置 的 PDP-7, 他 找 来 Dennis Ritchie 着 手 将 Space Travel 的 程序 移植 到 这 台 PDP-7 机 
器 上 。 这 就 是 UNIX RE RIE E 

到 了 1973 年 的 时 候 ,Ken Thompson 与 Dennis Ritchie 感到 用 汇编 语言 做 移植 太 过 
于 头痛 ,他 们 想 用 高 级 语言 来 完成 第 3 版 。 一 开始 他 们 想 尝 试用 Fortran ,可 是 失败 了 , 随 
后 他 们 使 用 当时 的 BCPL 语言 来 开发 第 3 版 UNIX。 他 们 整合 了 BCPL 形成 也 语言 ,可 
是 Dennis Ritchie 觉得 了 语言 还 是 不 能 满足 要 求 , 于 是 就 改良 了 也 语言 ,这 就 是 今天 大 名 
鼎鼎 的 C 语言 。 于 是 ,Ken Thompson 5j Dennis Ritchie 成 功 地 用 C 语言 重 写 了 UNIX 
的 第 3 版 内 核 ,使 得 UNIX 操作 系统 的 修改 ,移植 相当 便利 ,为 UNIX 日 后 的 普及 打下 了 
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坚实 的 基础 。 而 UNIX 也 与 C 语言 完美 地 结合 成 为 一 个 统一 体 , 至 今 为 止 ,C 语言 都 是 
编写 系统 级 程序 的 有 力 工 具 。 

UNIX 至 今 仍然 是 操作 系统 中 的 一 个 重要 代表 , 它 运行 时 的 安全 性 、 可 靠 性 以 及 强大 
的 计算 能 力 得 到 了 广大 用 户 的 信赖 。 促 使 UNIX 系统 成 功 的 因素 有 三 点 : 第 一 ,由 于 
UNIX 是 用 C 语言 编写 ,因此 它 是 可 移植 的 , 它 可 以 运行 在 笔记 本 电脑 .PC 工作 站 其 至 
大 型 机 器 上 ;第 二 ,系统 源 代码 非常 有 效 ,系统 容易 适应 特殊 的 需求 ;第 三 , 它 是 良好 的 、 通 
用 的 、 多 任务 和 分 时 的 操作 系统 。 

尽管 UNIX 已 经 不 再 是 一 个 实验 项 目 , 但 它 仍然 伴随 着 操作 系统 设计 技术 的 进步 而 
继续 成 长 ,人 们 仍然 可 以 把 它 作为 一 个 通用 的 操作 系统 用 于 研究 和 演练 。 不 过 ,因为 
UNIX 最 终 变 成 了 一 个 商业 操作 系统 ,企业 需要 支付 费用 才能 使 用 UNIX, 这 限制 了 它 的 
使 用 范围 ,特别 是 限制 了 普通 用 户 的 使 用 。Linux 的 出 现 完全 改变 了 这 种 局 面 。 

2. Linux 起 源 与 发 展 

Linux 的 第 一 个 版 本 诞生 于 1991 年 , 它 的 作者 Linus Torvalds 当时 是 芬兰 赫尔辛基 
大 学 计算 机 系 的 一 名 学 生 。Linus 在 做 一 个 调度 系统 作业 时 , 突 发 灵感 ,决定 将 其 改造 成 
一 个 实用 的 操作 系统 。Linus 所 设计 的 这 个 操作 系统 基于 Minix, Minix 是 Andrew 
Tannebaum 教授 编写 的 一 个 用 于 教学 的 操作 系统 ,是 基于 微 内 核 架 构 的 类 UNIX 操作 系 
统 , 该 教授 为 了 方便 给 他 的 学 生 上 课 , 购 买 了 UNIX 操作 系统 ,并 进行 裁剪 ,公开 了 Minix 
的 源 代码 。Linus 希望 自己 开发 的 这 个 操作 系统 变 得 比 Minix 更 为 实用 和 强壮 ,于 是 
Linus 决定 把 自己 所 设计 的 操作 系统 源 代码 也 公布 于 众 , 并 且 欢 迎 任何 人 帮助 修改 和 扩 
充 自己 的 系统 ,这 个 系统 就 是 今天 久负盛名 的 Linux, Linus 选择 了 备 受 推崇 的 UNIX 系 
统 接口 标准 (POSIX) ,由 此 Linux 成 为 UNIX 风格 操作 系统 家 族 中 的 一 员 , 而 且 代 码 是 
完全 公开 的 一 款 操作 系统 。 

Linux 的 生命 力 来 源 于 它 的 开源 思想 ,自从 Linus 公开 Linux 源 代码 以 来 ,世界 各 地 
的 软件 工程 师 和 程序 设计 爱好 者 积极 地 对 Linux 系统 进行 修改 和 加 强 。1991 年 Linus 
公开 了 Linux 内 核 之 后 ,其 内 核 版 本 逐步 从 1. 0 提高 到 2. 2 版 本 、2.6 版 本 、3.0 版 本 、3.2 
版 本 .4.7 版 本 .5.0 版 本 ,并 且 拥 有 数 百 个 Linux 发 行 版 本 。 同 时 Linux 也 被 从 初期 的 
x86 平台 移植 到 了 PowerPC, ARM,SPARC, MIPS, 68k 等 几乎 市 面 上 能 找到 的 所 有 体系 
结构 上 ,尤其 是 建立 在 Linux 之 上 的 Android 系统 ,显著 地 提高 了 Linux 系统 的 实用 性 。 
Linux 目前 广泛 应 用 于 服务 器 领域 .桌面 领域 .移动 嵌入 式 领 域 以 及 云 计算 大 数据 领域 ， 
并 且 依然 保持 着 强劲 的 发 展 趋势 。 

3. GNU 和 Linux 

Linux 能 够 诞生 并 发 展 到 今天 是 无 数 人 共同 努力 的 结果 。 操 作 系统 的 系统 内 核 本 身 
仅仅 是 可 用 开发 系统 的 一 小 部 分 。 传 统 上 ,商业 化 的 UNIX 系统 都 包含 提供 系统 服务 和 
工具 的 应 用 程序 。 对 Linux 系统 来 说 ,这 些 额 外 的 程序 是 由 众多 程序 员 编写 并 自由 发 布 
的 。Linux 社区 支持 自由 软件 的 概念 , 即 软件 本 身 不 应 受 限 ,这 些 软件 和 派生 工作 都 遵守 
GUN 通用 公共 许可 证 (GPL)。GNU Æ GNU is Not UNIX 的 递归 缩写 , 它 是 自由 软件 
基金 会 的 一 个 项 目 , 该 项 目的 目标 是 开发 一 个 自由 的 UNIX 版 本 。GPL 允许 软件 作者 拥 
有 软件 版 权 ,并 授予 其 他 任何 人 以 合法 复制 ,发 行 和 修改 软件 的 权利 。 
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下 面 是 在 GPL 条 款 下 发 布 的 一 些 主要 的 GNU 项 目 软件 。 
* GCC; GNU 编译 器 集 , 它 包括 GNU C 编译 器 。 

* Gt CH 编译 器 ,是 GCC 的 一 部 分 。 

* GDB: 源 代码 级 的 调试 器 。 

GNU make: UNIX make 命令 的 免费 版 本 。 

* Bison: 与 UNIX yace 兼容 的 语法 分 析 程序 生成 器 。 

。 bash: 命令 解释 器 (Shell) 。 

* GNU Emacs: 文本 编辑 器 及 环境 。 
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1. Linux 内 核 

操作 系统 (Operating System,OS) 是 管理 和 控制 计算 机 硬件 与 软件 资源 的 计算 机 程 
序 ,是 直接 运行 在 * 裸 机 "上 的 最 基本 的 系统 软件 ,其 他 任何 软件 都 必须 在 操作 系统 的 支持 
下 才能 运行 。 操 作 系统 从 处 理 机 状态 的 角度 分 为 两 部 分 ,一 部 分 是 内 核 , 另 一 部 分 是 其 他 
程序 。 

内 核 , 是 一 个 操作 系统 的 核心 ,是 基于 硬件 的 第 一 层 软 件 扩充 ,提供 操作 系统 的 最 基 
本 的 功能 ,是 操作 系统 工作 的 基础 。 它 负责 管理 系统 的 进程 内存, 设备 驱动 程序 ,文件 和 
网 络 系统 ,决定 着 系统 的 性 能 和 稳定 性 。 现 代 操 作 系 统 设计 中 ,为 减少 系统 本 身 的 开销 ， 
往往 将 一 些 与 硬件 紧密 相关 的 (如 中 断 处 理 程序 ,设备 驱动 程序 等 ) ,基本 的 、 公 共 的 、 运 行 
频率 较 高 的 模块 (如 时 钟 管理 、 进 程 调度 等 ) 以 及 关键 性 数据 结构 独立 开 来 ,使 之 常 驻 内 
存 , 并 对 它们 进行 保护 ,通常 把 这 一 部 分 称 之 为 操作 系统 的 内 核 。“ 内 核 指 的 是 一 个 提供 
硬件 抽象 层 磁盘 及 文件 系统 控制 多 任务 等 功能 的 系统 软件 。 

Linux 内 核 是 该 操作 系统 的 核心 程序 文件 ,通过 与 其 他 程序 文件 的 组 合 ,Linux 又 构 
成 了 许多 版 本 。 每 种 Linux 版 本 都 有 其 特点 ,例如 嵌入 式 Linux 版 本 内 核 很 小 ,专门 用 于 
管理 较 小 的 电子 设备 ,而 用 户 常 使 用 的 Linux 桌面 版 和 Linux 企业 版 ,它们 的 内 核 很 庞 
大 ,能 够 提供 丰富 的 管理 功能 。Linux 内 核 的 结构 如 图 1. 1 所 示 。 内 核 提 供 了 进程 调度 、 
进程 通信 虚拟 文件 系统 、 网 络 管理 ,内 存 管理 .设备 驱动 以 及 系统 调用 。 用 户 的 应 用 程序 
通过 系统 调用 或 库 函 数 实现 对 计算 机 资源 的 管理 和 使 用 。 

Linux 内 核 继承 了 UNIX 内 核 的 大 多 数 特 点 ,并 保留 相同 的 API( 应 用 程序 接口 ) 来 
保证 应 用 程序 的 可 移植 性 。Linux 内 核 支持 动态 加 载 内 核 模块 ,支持 对 称 多 处 理 (SMP) 
机 制 ,可 抢占 进程 调度 ,提供 具有 设备 类 面向 对 象 的 设备 模型 .支持 热 拔 插 事 件 ,支持 用 户 
空间 的 设备 文件 系统 ,忽略 了 一 些 被 认为 是 设计 拙劣 的 UNIX 特性 和 过 时 标准 。 

2. Linux 内 核 态 和 用 户 态 

在 计算 机 系统 中 ,通常 运行 着 两 类 程序 : 系统 程序 和 用 户 程 序 。 为 了 保证 系统 程序 
不 被 应 用 程序 有 意 或 无 意 地 破坏 ,Linux 操作 系统 将 计算 机 系统 设置 为 两 种 状态 , 即 内 核 
态 和 用 户 态 ;Linux 内 核 程序 工作 在 内 核 态 ;内 核 之 外 的 其 他 程序 则 工作 在 用 户 态 。 

内 核 态 是 操作 系统 内 核 程序 运行 的 状态 ,拥有 较 高 的 特权 级 别 , 可 以 执行 全 部 指令 
(包括 特权 指令 ) ,可 使 用 所 有 资源 ,并 具有 改变 处 理 器 状态 的 能 力 。 用 户 态 是 用 户 程 序 运 
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图 1.1 Linux 内 核 构架 


行 时 的 状态 ,只 可 以 执行 非特 权 指 令 , 只 能 使 用 有 限 的 资源 ,只 能 使 用 用 户 内 存 空 间 , 而 不 
能 访问 操作 系统 常 驻 的 系统 内 存 空间 。 

3. Linux 内 核 版 本 和 发 行 版 本 

Linux 版 本 分 为 两 类 : 内 核 版 本 和 发 行 版 本 。 内 核 版 本 是 指 Linux 创始 人 Linus 领 
导 的 开发 小 组 所 开发 并 发 布 的 操作 系统 内 核 版 本 ,如 4. 8.2, 通 常 在 内 核 版 本 号 后 还 会 附 
加 一 个 数字 ,如 4. 8. 2-19, 最 后 的 数字 表示 该 版 本 的 内 核 是 第 几 次 修订 的 。 

内 核 版 本 号 通常 由 3 组 数字 组 成 : 主 版 本 号 、 次 版 本 号 、 次 次 版 本 号 。 如 内 核 版 本 
4. 8. 2,4 为 主 版 本 号 ,8 为 次 版 本 号 ,2 为 次 次 版 本 号 。 当 内 核 有 重大 改变 时 , 主 版 本 号 会 
加 1; 当 内 核 只 有 小 改动 时 ,次 版 本 号 会 加 1, 比如 增加 了 一 些 新 特性 ,支持 更 多 种 类 的 硬 
件 ; 当 内 核 只 有 轻微 的 改动 时 ,次 次 版 本 号 会 加 1。 如 果 次 版 本 号 为 偶数 表示 内 核 版 本 是 
稳定 版 ,如 果 是 奇数 表示 内 核 版 本 是 测试 版 ,可 能 不 是 很 稳定 ,用 户 使 用 时 应 注意 使 用 次 
版 本 号 为 偶数 号 的 内 核 版 本 。 

Linux 内 核 只 是 实现 了 操作 系统 最 为 关键 的 部 分 ,只 有 在 此 基础 上 提供 用 户 界面 , 增 
加 一 些 具 有 实用 人 性 的 应 用 软件 ,用 户 才能 方便 地 使 用 它 。 一 些 公司 或 组 织 将 Linux 内 核 
和 常用 的 应 用 软件 包装 在 一 起 ,发 行 给 用 户 使 用 ,就 构成 了 Linux 的 发 行 版 本 ,很 多 
Linux 发 行 版 本 虽然 内 核 一 样 , 但 添加 的 应 用 软件 不 同 ,就 形成 了 不 同 的 发 行 版 本 。 一 个 
典型 的 Linux 发 行 版 包括 : Linux 内 核 ,一 些 GNU 程序 库 和 工具 ,命令 行 Shell, 图 形 界 
面 的 X Window 系统 和 相应 的 桌面 环境 ,如 KDE 或 GNOME, 并 包含 数 千 种 从 办 公 套 
件 、 编 译 器 文本 编辑 器 到 科学 工具 的 应 用 软件 。 对 于 初学 者 ,发行 版 本 的 概念 更 为 重要 
一 些 , 发 行 版 本 经 过 了 严格 的 测试 ,提供 了 丰富 的 应 用 软件 ,这 样 初学 者 可 以 很 方便 地 使 
用 Linux 并 享受 Linux 带 来 的 强大 功能 。 

以 下 是 一 些 常用 的 Linux 发 行 版 本 。 

(D) Ubuntu: Ubuntu 是 一 个 以 桌面 应 用 为 主 的 Linux 操作 系统 ,提供 了 一 个 健壮 
的 、 功 能 丰富 的 系统 环境 ,适用 个 人 用 户 使 用 或 商业 环境 。Ubuntu 支持 各 种 架构 ,包括 
1386, AMD 以 及 PowerPC 等 。Ubuntu 默认 采用 GNOME 桌面 系统 ,同时 也 发 行 KDE 
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桌面 的 Kubuntu 版 本 、Xfce 桌面 的 Xubuntu 版 本 。 

(2) Red Hat Linux: Red Hat Linux 是 最 著名 的 Linux 版 本 之 一 ,Red Hat Linux 是 
Red Hat 公司 所 发 行 的 版 本 ,并 且 为 用 户 提 供 有 偿 的 技术 服务 与 升级 服务 。 该 版 本 适用 
于 各 种 企业 的 服务 器 应 用 ,支持 大 型 数据 库 和 应 用 系统 ,功能 强大 而 且 系 统 内 性 能 稳定 。 

(3) CentOS; CentOS 是 一 个 基于 Red Hat Linux 且 提 供 开放 源 代码 的 企业 级 Linux 
发 行 版 本 , 它 提供 了 一 个 安全 、 低 维护 ,稳定 、 高 预测 性 和 高 重复 性 的 Linux 环境 。 
CentOS 来 自 于 Red Hat Enterprise Linux, 依 照 开放 源 代码 规定 释 出 的 源 代码 所 编译 而 
成 ,因此 具有 同样 的 核心 源 代 码 , 对 有 高 度 稳定 性 要 求 的 服务 器 应 用 ,可 以 用 CentOS $? 
代 商 业 版 的 Red Hat Enterprise Linux 使 用 。 

(4) openSUSE: openSUSE 是 一 个 一 般 用 途 的 基于 Linux EI] GNU/Linux 操作 
系统 ,近年 来 广 受 欢 迎 ,是 德国 著名 的 Linux 发 行 版 本 ,由 Novell 公司 负责 项 目的 维护 。 
openSUSE 采用 KDE 4. 3 作为 其 默认 的 桌面 环境 ,同时 也 提供 GNOME 桌面 版 本 。 
openSUSE 提供 了 自主 开发 的 YaST 软件 包 管 理 系统 ,受到 用 户 的 好 评 。 它 性 能 良好 , 同 
时 提供 的 用 户 界面 非常 华丽 ,甚至 超越 了 Windows 7。openSUSE 适用 于 各 种 软件 开发 
工作 站 ,集成 了 多 种 常用 的 工具 。 

(5) Debian: Debian 是 至 今 为 止 最 遵循 GNU 规范 的 Linux 系统 ,在 全 球 有 超过 
1000 人 的 开发 团队 为 Debian 开发 了 超过 20000 个 软件 包 , 这 20000 个 软件 包 覆 盖 了 11 
种 不 同 的 处 理 器 。 世 界 上 有 超过 120 份 Linux 发 行 版 本 是 以 Debian 为 基础 的 ,包括 现在 
广泛 使 用 的 Ubuntu。 该 版 本 适用 于 研究 Linux 系统 ,可 以 快速 得 到 各 种 系统 分 析 与 测试 
工具 。 


1.2 Linux 系统 编程 
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计算 机 软件 可 以 分 为 应 用 软件 和 系统 软件 两 大 类 。 我 们 平时 所 使 用 的 工具 软件 、 游 
戏 软件 .管理 软件 等 都 属于 应 用 软件 。 系 统 软件 是 负责 管理 计算 机 系统 中 各 种 独立 的 硬 
TE ,使 得 它们 可 以 协调 工作 的 程序 ,主要 包括 操作 系统 及 其 补丁 硬件 驱动 程序 和 一 系列 
基本 的 工具 ,比如 编译 器 .数据库 管理 ` 网 络 连接 等 方面 的 工具 。 系 统 编程 就 是 编写 系统 
软件 级 别 的 程序 ,简单 地 说 ,就 是 通过 系统 调用 接口 ,使 用 操作 系统 提供 的 功能 来 设计 
程序 。 

在 以 单 用 户 单 任务 方式 使 用 计算 机 的 时 代 , 系 统 软件 并 不 是 必需 的 。 在 此 方式 下 , 任 
一 时 间 段 内 计算 机 系统 中 都 只 有 一 个 程序 在 运行 ,因此 该 程序 可 以 按照 自己 的 需要 使 用 
系统 中 的 资源 。 随 着 计算 机 系统 不 断 地 发 展 ,多 用 户 多 任务 的 计算 机 系统 已 成 为 当前 计 
算 机 使 用 方式 的 主流 , 绝 大 部 分 时 间 系 统 中 都 会 有 多 个 程序 在 运行 ,众多 的 运行 程序 一 定 
会 争 用 计算 机 系统 的 各 类 资源 ,如 果 仍 然 允许 用 户 程序 随意 使 用 系统 资源 ,必然 会 造成 混 
乱 。 因 此 ,不 能 再 由 用 户 程序 直接 去 连接 相应 的 设备 ,需要 由 操作 系统 最 基本 的 部 分 一 一 
内 核 统一 来 控制 。 而 操作 系统 本 身 也 是 一 个 特殊 的 程序 ,也 在 内 存 中 运行 。 这 种 情况 下 ， 
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设计 出 安全 ,稳定 、 高 效 的 系统 软件 就 显得 格外 重要 ,系统 编程 也 因此 应 运 而 生 。 在 编写 
系统 软件 时 ,我们 将 操作 系统 运行 的 内 存 空 间 称 为 系统 空间 或 内 核 空间 ,普通 程序 运行 的 
内 存 空间 称 为 用 户 空间 。 如 1.1.2 节 所 述 , 根 据 计 算 机 系统 不 同 的 运行 状态 ,Linux 系统 
的 运行 状态 分 为 内 核 态 和 用 户 态 。 


122 系统 编程 的 学 习 内 容 及 方法 


系统 编程 更 接近 硬件 ,因此 在 进行 系统 编程 时 ,设计 开发 人 员 必 须 对 计算 机 系统 的 结 
构 和 工作 方式 ,操作 系统 环境 有 较 深 的 了 解 。 设 计 开 发 人 员 需 要 熟知 : 内 核 提 供 哪些 服 
务 ,如何 使 用 它们 ;系统 有 哪些 资源 和 设备 ;不 同 的 资源 和 设备 该 如 何 操作 。 

为 此 ,学习 过 程 中 需要 逐步 掌握 以 下 内 容 : 

(1) 了 解 内 核 所 提供 的 各 种 类 型 的 服务 (系统 调用 ) 。 

(2) 各 种 内 核 服务 具体 有 什么 特点 ,会 用 到 哪些 参数 ,会 提供 哪些 数据 (数据 结构 、 函 
数 参数 .返回 值 ) 。 

(3) 掌握 内 核 服务 的 机 制 。 

这 些 服 务 使 开发 人 员 编写 的 程序 能 够 顺利 地 使 用 计算 机 系统 的 各 类 资源 ,这 些 资源 
包括 : 

。 处 理 器 : 安排 一 个 程序 何 时 开始 执行 , 何 时 暂停 .恢复 执行 , 何 时 终止 执行 。 
W/O 设备 : 程序 终端 ,存储 设备 中 所 有 的 I/O 数据 都 必须 流 经 内 核 ,以 保证 1/O 
数据 的 正确 性 .有效 性 和 安全 性 。 
进程 管理 : 如 何 新 建 一 个 进程 终止 进程 .对 进程 进行 调度 ;同时 还 需要 管理 与 进 
程 相关 的 内 存 、 文 件 等 系统 资源 。 
内 存 : 内 核 要 在 进程 需要 时 为 其 分 配 内 存 , 不 需要 时 回收 内 存 , 并 确保 内 存 不 被 
其 他 的 进程 非法 访问 。 
设备 : 内 核 要 负责 程序 和 设备 的 合法 连接 ,屏蔽 不 同 设备 使 用 时 的 差异 ,使 得 设 
备 的 操作 方式 简单 而 统一 。 
进程 间 通 信 : 不 同 的 进程 之 间 需 要 通信 ,内核 需 要 为 其 通信 提供 服务 。 
网 络 服务 : 网 络 通信 可 以 看 作 是 进程 间 通 信 的 特殊 形式 ,内 核 也 需要 为 其 提供 
服务 。 
在 本 书 中 ,使 用 以 下 的 方法 来 学 习 设计 系统 程序 。 
。 分 析 程 序 : 首先 分 析 现 有 的 系统 程序 。 作 为 开源 软件 ,Linux 是 一 份 非常 优秀 的 
学 习 资 料 , 读 者 可 以 按照 自己 的 喜好 ,挑选 难度 合适 的 代码 进行 学 习 。 本 书 假定 
读者 的 身份 是 系统 编程 的 初学 者 ,主要 以 分 析 常 见 命令 程序 来 讲解 内 核 提供 的 各 
种 服务 及 程序 实现 的 原理 。 
学 习 系 统 调用 及 数据 结构 : 通过 阅读 源 代 码 或 查阅 man 手册 对 命令 的 说 明 ,学 习 
命令 程序 中 使 用 的 数据 结构 和 内 核 提供 的 系统 调用 。 同 时 ,加 深 对 操作 系统 的 
认识 。 
编程 实现 : 利用 学 习 到 的 原理 、 操 作 系 统 提供 的 数据 结构 和 系统 调用 ,可 以 仿照 
命令 程序 编程 实现 自己 的 命令 程序 或 者 实现 新 功能 的 命令 程序 。 
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本 节 通 过 一 个 示例 来 展示 如 何 学 习 系 统 编程 。ls 是 Linux 系统 中 被 使 用 最 多 的 命令 
之 一 , 它 的 功能 是 显示 当前 目录 下 的 所 有 文件 名 称 。 

首先 使 用 man 命令 来 看 看 会 不 会 有 一 些 有 用 的 信息 被 我 们 遗漏 了 。 在 Linux 系统 
的 终端 中 输入 以 下 命令 : 


man ls 


执行 该 命令 ,屏幕 显示 的 信息 如 图 1. 2 所 示 ( 关 于 ls 完整 的 信息 当然 比 图 中 显示 的 
内 容 要 多 ,此 处 只 截取 了 需要 的 内 容 ) 。 


User Commands 
LS(1) 


ls - list directory contents 


SYNOPSIS 
1s [OPTION]... [EILE]... 


DESCRIPTION 
List information about the FILES (the current directory by default). Sor 
t entries alphabetically if none of -cftuvSUX nor --sort is specified. 


图 1.2 man ls 的 结果 


从 1s 命令 的 DESCRIPTION 中 ,可 以 看 到 ls 命令 的 功能 是 : 列 出 指定 目录 下 文件 的 
信息 (默认 为 当前 的 目录 ) ,如 果 没 有 指明 -cftuvSUX -sort 选项 的 话 将 会 按 字母 顺序 以 
文件 名 为 排序 对 象 来 排列 并 显示 这 些 文件 的 信息 

思考 一 下 ,这 些 文件 的 信息 是 从 哪里 来 的 ? 显然 和 1s 后 指定 的 目录 是 有 关 的 ,那么 
目录 文件 可 以 读 吗 ? 尝试 用 cat 和 more 命令 读 当 前 目录 ,可 以 得 到 如 下 的 结果 。 

root(ubuntu:« $ cat . 

cat: .: 是 一 个 目录 

root@ubuntu:~ $more . 


» 。: 目录 xx%x 

可 以 看 到 cat 和 more 命令 无 法 操作 目录 文件 ,那么 有 哪些 命令 或 者 函数 可 以 读 出 目 
录 文 件 的 内 容 呢 ?可 以 试 着 使 用 man 手册 ,输入 以 下 命令 : 

men - k directory 

条 命令 表示 在 man 手册 中 以 directory 为 关键 字 进 行 查询 ,该 命令 执行 后 将 会 显示 

bbs 条 a 不 同 ,显示 出 的 结果 也 不 尽 相 同 ) 。 为 了 进 一 
步 缩 小 查找 的 范围 ,在 查询 的 结果 中 加 入 grep read 表示 查找 与 读 目录 相关 的 命令 、 函 数 
或 系统 调用 ,得 到 以 下 结果 。 


root@uantu:~# man — k directory|grep read 
readdir (2) — read directory entry 


readdir (3) — read a directory 
readdir r (3) — reed a directory 
seekdir (3) -set the position of the next readdir() call in the dir... 


结果 中 显示 ,与 读 目 录 文 件 相关 的 结果 有 readdir,readdir r 和 seekdir, 其 中 可 能 性 
最 大 的 是 readdir 函数 或 系统 调用 ,readdir 函数 在 man 手册 的 第 2 章 ,readdir 系统 调用 
在 man 手册 的 第 3 章 。 分 别 输 入 man 2 readdir 和 man 3 readdir, 将 会 看 到 这 两 个 
readdir 函数 参数 不 同 。 由 于 是 设计 系统 软件 ,因此 选择 系统 调用 readdir(3) ,其 原型 为 : 

# include« dirent.h» 

struct dirent * readdir(DIR * dirp); 
其 中 参数 dirp 类 型 为 DIR 类 型 指针 ,返回 值 类 型 为 struct dirent 类 型 指针 ,在 readdir FR 
数 的 描述 中 给 出 了 struct dirent 类 型 的 定义 。 继 续 向 下 翻 看 ,在 see also 中 列 出 了 众多 
与 readdir HXW PR C. 5 C 语言 对 文件 的 标准 操作 方式 和 操作 文件 时 使 用 的 函数 ， 
与 读 目录 文件 相关 的 其 他 操作 ,应 该 就 是 opendir 和 closedir 了 ,并 且 读 取 目 录 文件 的 
过 程 与 读 取 普 通 文件 类 似 。 再 来 查看 opendir 和 closedir 函数 的 使 用 方法 ,它们 的 原 
WH: 


# include< sys/types.h> 

# include< dirent.h» 

DIR * cpendir(const char * name); 

int closedir(DIR * dirp); 

从 描述 中 可 以 看 到 opendir 函数 打开 目录 文件 ,并 将 文件 的 读 写 指针 置 于 目录 文件 
的 起 始 处 。closedir 函数 用 来 关闭 打开 的 目录 文件 。 

其 中 opendir 函数 以 目录 文件 的 文件 名 为 参数 ,其 返回 值 为 指向 目录 文件 的 DIR 类 
型 指针 ,该 指针 正 是 readdir 要 使 用 的 参数 。 目 录 文 件 就 像 一 张 表 格 一 样 , 它 由 若干 目录 
项 组 成 ,每 一 个 目录 项 记录 了 一 个 文件 的 信息 ,具体 记录 的 属性 由 结构 体 dirent 来 确定 ， 
其 类 型 定义 如 下 : 


struct dirent ( 


ino t d ino; /* inode number * / 

off t d off; /* notan offset; see NOTES * / 

unsigned short d reclen; /* length of this record * / 

unsigned char d type; /* type of file; not supported by all 
filesystem types * / 

char d name[256]; /* filenme * / 


H 


readdir 函数 每 执行 一 次 ,就读 出 一 条 文件 的 信息 ,同时 文件 读 写 指针 移动 到 下 一 个 
文件 信息 的 起 始 处 。 当 readdir 返回 NULL 时 ,表示 已 读 至 文件 末尾 。 查 看 了 三 个 函数 
的 原型 后 ,就 可 以 确定 实现 1s 命令 的 程序 流程 如 图 1. 3 Bros ,我 们 把 这 个 命令 程序 称 为 
简单 ls 命令 。 
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CHR 


打开 指定 的 目录 文件 


提示 打开 文件 失败 


? N 
关闭 目录 文件 

输出 该 目录 项 

中 的 文件 名 称 结束 


图 1.3 简单 ks 命令 程序 的 流程 图 


按 此 流程 可 以 编写 出 简单 ls 命令 的 程序 : 


[示例 程序 1.1] 
# include< stdio.h> 
# include< stdlib.h> 
# include< dirent.h» 
int main() 
t 
DIR * dir; 
struct dirent * ptr; 
if((dir- cpendir ("."))- — NULL) 
i 
perror ("cpendir"); 
exit(EXIT FAILURE); 
? 
while((ptr- readdir (dir) ) != NULL) 
i 
printf ("%s\t\t", ptr->d name); 
和 
closedir (dir); 
retum 0; 
) 


从 这 个 例子 中 可 以 总 结 一 下 本 书 推荐 学 习 系 统 编程 的 几 个 步骤 ， 
CD 首先 学 习 系统 命 令 , 了 解 系统 命令 的 功能 ; 

(2) 根据 man 手册 和 已 有 的 程序 设计 知识 来 分 析 命 令 的 实现 原理 ; 
(3) 从 man 手册 中 学 习 相 关 的 数据 结构 和 系统 调用 的 使 用 方法 ; 
(4) 写 出 自己 的 命令 程序 ; 
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(5) 最 终 在 自己 的 程序 中 能 够 使 用 这 些 数 据 结构 及 系统 调用 。 
124 系统 调用 和 库 函 数 


到 目前 为 止 ,本 书 中 频繁 提 到 了 系统 调用 这 个 词 , 从 1. 2. 3 节 的 内 容 可 以 看 到 : 尽管 
从 形式 上 来 看 ,系统 调用 和 库 函 数 都 是 C 函数 ,但 从 操作 系统 的 角度 来 看 ,系统 调用 和 库 
函数 有 着 非常 大 的 区 别 。 

系统 调用 是 操作 系统 为 用 户 态 运 行 的 进程 与 硬件 设备 (如 CPU 磁盘 、 打 印 机 等 ) 进 
行 交 互 所 提供 的 一 组 接口 。 使 用 系统 调用 后 ,该 进程 的 状态 从 用 户 态 切换 到 内 核 态 。 系 
统 调用 可 以 说 是 操作 系统 留 给 用 户 程序 的 一 个 接口 。 

从 这 一 定义 可 以 看 出 系统 调用 完成 特定 功能 ,与 操作 系统 直接 相关 ,不 同 操作 系统 的 系 
统 调 用 可 能 不 同 ,因此 使 用 系统 调用 编写 的 代码 可 移 


植 性 不 高 。 系 统 调用 并 非 ANSI C 标准 ,所 以 不 同 的 FURY 
操作 系统 或 不 同 Linux 内 核 版 本 的 系统 调用 函数 可 | 
能 不 同 。 在 预 编译 命令 中 包含 系统 调用 所 在 的 函数 mum] | 用 户 态 
库 时 需要 在 头 文件 前 加 上 相对 路 径 sys/。 | 
库 函 数 通常 用 于 完成 一 些 常见 的 功能 ,要 满足 -----] 系统 调用 “十 ------ 
一 定 的 标准 (例如 ISO C)。 库 函数 作为 程序 设计 语 
言 的 一 部 分 可 以 不 加 修改 地 应 用 于 不 同 的 平台 , 因 Lm | rus 
此 具有 良好 的 可 移植 性 。 库 函数 的 实现 最 终 也 要 调 
用 系统 调用 ,但 它 封装 了 系统 调用 的 部 分 操作 。 系 SE 


统 调用 与 库 函 数 关系 如 图 1.4 所 示 。 
本 书 中 在 不 影响 程序 编写 的 情况 下 ,将 系统 调 图 1.4 系统 调用 和 库 函数 的 关系 

用 和 库 函 数 均 称 为 函数 。 如 果 读 者 需要 确认 使 用 的 

函数 是 系统 调用 还 是 库 函 数 ,可 以 使 用 man 手册 进行 查询 。 
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131 命令 格式 

打开 Linux 系统 的 Shell, 在 Shell 中 可 以 使 用 命令 来 操作 计算 机 系统 。 终 端 环 境 下 
的 命令 格式 为 : 

指令 名 称 [选项 ] [参数 列表 ] 


在 同一 行 中 ,可 以 输入 一 条 以 上 的 指令 ,但 各 指令 之 间 要 使 用 分 号 间隔 开 , 系统 将 会 
按 次 序 执行 命令 序列 。 

指令 在 执行 过 程 中 可 以 使 用 指令 选项 ,这 样 可 以 在 执行 动作 之 后 产生 不 同 的 结果 , 选 
项 通常 以 -开头 ,例如 下 面 的 命令 ; 


ls -1 7 
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这 条 命令 表示 显示 根 目录 下 文件 的 详细 信息 ,包括 文件 权限 、 属 主 、 大 小 等 ;不 加 选项 
-1 时 ,表示 显示 根 目录 下 所 有 文件 的 名 称 。 

参数 是 指 指令 操作 的 对 象 ,例如 上 面 命令 中 的 “/”, 表 示 本 次 操作 的 对 象 是 根 目录 。 
参数 中 可 以 使 用 通配符 ,各 通配符 的 含义 如 下 : 

tox : 代表 文件 名 中 任意 长 度 的 字符 串 。 

。 ?: 代表 文件 名 中 的 任 一 字符 。 

。 0: 代表 文件 名 中 任 一 属于 [ ] 中 列 出 的 字符 集 的 字符 。 

例如 ,当前 目录 下 有 12 个 文件 ,名 称 分 别 为 filel \file2 ,file3、…… ~ filel10 filell, 
filel2, 此 时 可 执行 以 下 命令 : 


1s filex 列 出 所 有 以 file 开 头 的 文件 
1s filel? 列 出 文件 filel0、filell, filel2 
1s file[3- 9] 列 出 文件 file3 file9 
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1321 打包 工具 
1. tar 
tar 是 Linux 下 常用 的 打包 、 压 缩 和 解压 工具 ,使 用 格式 为 : 
tar[ 选 项 ] 结果 文件 名 / 待 打 包 文件 名 
可 使 用 以 下 几 个 选项 : 
* -c: 创建 文件 。 
。 -z: EBH gzip 压缩 。 
。 -x: 解压 文件 。 
。-v: 压缩 或 解压 过 程 中 显示 进度 。 
e -f 给 新 文档 命名 ,f 后 直接 跟 新 文件 名 ,不 再 加 其 他 参数 。 
除了 以 上 的 参数 ,还 可 以 通过 man 手册 查看 其 他 参数 的 含义 。 将 当前 目录 下 的 所 有 
文件 作为 待 压缩 文件 进行 打包 或 压缩 ,命令 如 下 : 
。 打包 : tar -cvf mytar. tar ./* 
* 压缩 : tar -zcvf mytar. tar.gz ./* 
* 解 包 : tar -xvf mytar.tar -C ./my 
。 解压 : tar -zxvf mytar. tar.gz -C ./my 
以 上 命令 中 的 -C 选项 表示 将 打包 文件 或 压缩 文件 解压 到 指定 的 目录 中 。 通 常 在 压 
缩 打 包 文 件 时 ,通过 给 文件 添加 后 绥 来 区 分 文件 的 类 型 ,一般 文件 名 后 加 . tar 的 表示 该 文 
件 为 打包 文件 ,加 . tar. gz 表示 该 文件 是 用 gzip 压缩 的 tar 文件 。 
2. gzip 
gzip 是 GNUzip 的 缩写 , 它 是 GNU 提供 的 一 个 文件 压缩 程序 。 其 使 用 格式 为 : 
gip [选项 ] 压缩 解压 缩 ) 的 文件 名 
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该 命令 可 使 用 的 选项 含义 如 下 : 

。-c: 将 输出 写 到 标准 输出 上 ,并 保留 原 有 文件 。 

。 -d: 将 压缩 文件 解压 。 

。 -1: 显示 每 个 压缩 文件 的 压缩 部 分 的 大 小 、 未 压缩 部 分 的 大 小 、 压 缩 比 \ 未 压缩 文 

件 的 名 字 。 

。-r; 递归 式 地 查找 指定 目录 并 压缩 其 中 的 所 有 文件 或 解压 缩 。 

。-t: 测试 ,检查 压缩 文件 是 否 完整 。 

。-v: 对 每 一 个 压缩 和 解压 的 文件 ,显示 文件 名 和 压缩 比 。 

gzip 只 能 压缩 文件 ,不 能 压缩 目录 ,如 果 要 压缩 目录 , 则 需要 使 用 -r 选项 。 

3. bzip2 

bzip2 是 一 个 基于 Burrows-Wheeler 变换 的 无 损 压 缩 软件 ,也 是 一 个 自由 软件 ,广泛 
存在 于 UNIX 和 Linux 的 许多 发 行 版 本 中 。 该 软件 由 Julian Seward 开发 ,Seward 在 
1996 年 7 月 第 一 次 公开 发 布 了 bzip2 0. 15 版 ,在 随后 几 年 中 这 个 压缩 工具 的 稳定 性 得 到 
改善 并 且 日 渐 流行 ,Seward 在 2000 年 发 布 了 1.0 版 。 

1322 文本 编辑 工具 

1. vi/vim 

vi 是 visual editor 的 简称 , 它 是 运行 在 Linux 操作 系统 中 的 一 个 文本 编辑 器 ,可 以 执 
行 输出 删除 查找、 替换 、 块 操作 等 众多 文本 操作 ,而且 用 户 可 以 根据 自己 的 需要 对 其 进 
行 定制 。 

vim 是 从 vi 发 展 而 来 的 一 个 文本 编辑 器 ,具有 代码 补 全 、 编 译 及 错误 跳 转 等 方便 编 
程 的 功能 ,被 程序 员 广泛 使 用 ,是 类 UNIX 系统 用 户 最 喜欢 的 两 大 文本 编辑 器 之 一 , 另 一 
个 是 Emacs。vim 的 相关 内 容 和 使 用 方法 将 在 2. 1. 2 节 中 进行 介绍 。 

2. Emacs 

Emacs 即 Editor MACroS( 宏 编辑 器 ) 的 缩写 .是 一 个 强大 的 文本 编辑 器 ,在 程序 员 和 
其 他 以 技术 工作 为 主 的 计算 机 用 户 中 广 受 欢迎 。Emacs 最 初 由 Richard Stallman 于 1975 
年 在 MIT 协同 Guy Steele 共同 完成 。 自 诞生 以 来 ,Emacs 演化 出 了 众多 分 支 ,其 中 使 用 
最 广泛 的 两 种 分 别 是 : 1984 年 由 Richard Stallman 发 起 并 由 他 维护 至 今 的 GNU Emacs， 
以 及 1991 年 发 起 的 XEmacs。XEmacs 是 GNU Emacs 的 分 支 , 至 今 仍 保持 着 良好 的 兼 
容 性 。 它 们 都 使 用 了 Emacs Lisp 这 种 有 着 极 强 扩展 性 的 编程 语言 ,从 而 实现 了 包括 编 
程 \ 编 译 乃 至 网 络 浏览 等 功能 的 扩展 。 

3. gedit 

gedit 是 一 套 自由 软件 , 它 是 一 个 GNOME 桌面 环境 下 兼容 UTF-8 的 文本 编辑 器 ， 
支持 包括 gb2312 、gbk 在 内 的 多 种 字符 编码 ,使 用 GTK 十 编写 而 成 ,简单 易 用 ,有 良好 的 
语法 高 亮 显示 ,对 中 文 支持 很 好 。 除 了 是 一 个 纯 文本 编辑 器 外 ,使 用 者 还 可 以 把 它 当 成 是 
一 个 集成 开发 环境 来 使 用 。 
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1. ping 

ping 命令 用 来 测试 主机 之 间 网 络 的 连通 性 。 使 用 格式 为 : 
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ping [参数 ] [主机 名 或 网 络 地 址 ] 


ping 命令 使 用 ICMP 传输 协议 ,会 向 指定 的 主机 发 出 要 求 回应 的 信息 ,车 远 端 主机 
的 网 络 功 能 没有 问题 ,就 会 回应 该 信息 ,因而 得 知 该 主机 运作 正常 。ping 命令 每 秒 发 送 
一 个 数据 包 并 且 为 每 个 接收 到 的 响应 打印 一 行 输出 。 例 如 ,在 终端 中 输入 "ping www. 
baidu. com”, 得 到 以 下 的 响应 。 


root@ubuntu:~ # ping waw.baidu.om 

PING www.a.shifen.ocm (220.181.111.188) 56(84) bytes of data. 

64 bytes fram 220.181.111.188: iam seg-3 ttl- 54 time- 27.9 ms 

64 bytes fram 220.181.111.188: iam seq-4 ttl- 54 time- 38.9 ms 

64 bytes from 220.181.111.188: iam seq- 5 ttl=54 time- 26.2 ms 

64 bytes fram 220.181.111.188: iam seq 6 tt]= 54 time- 27.6 ms 

64 bytes fram 220.181.111.188: iam seq-7 ttl=54 time- 28.6 ms 

^C 

—- - ww.a.shifen.com ping statistics -一 一 

7 packets transmitted, 7 received, 0%packet loss, time 6009ms 

rtt min/avg/max/mdev — 26.217/29.171/38.918/4.068 ms 

最 后 两 行 信息 中 ,ping 命令 会 计算 信号 往返 时 间 和 丢 包 情况 的 统计 信息 ,并 且 在 完 
成 之 后 显示 一 个 简要 总 结 。 有 些 服务 器 为 了 防止 通过 ping 被 探测 到 ,通过 防火 墙 设置 了 
禁止 ping 或 者 在 内 核 参 数 中 禁止 ping ,这样 就 不 能 通过 ping 确定 该 主机 是 否 还 处 于 开 
启 状 态 。 

2. ifconfig 

Linux 系统 的 ifconfig 命令 与 Windows 系统 中 的 ipconfig 命令 类 似 , 用 来 查看 和 配 
置 网 络 设备 , 当 网 络 环境 发 生 改 变 时 可 通过 此 命令 对 网 络 进行 相应 的 配置 。 

该 命令 使 用 格式 如 下 : 


ifconfig [网 络 设备 ] [参数 ] 
例如 : 


root@ubuntu:~ $ ifoonfig 

enp0s3 Iink encap: 以 太 网 硬件 地 址 08:00:27:93:47:60 
inet 地 址 :10.0.2.15 广播 :10.0.2.255 掩 码 :255.255.255.0 
inet6 地 址 : £e80::1e0d:5666:cf53:6eed/64 Soope:lánk 
UP BROADCAST RUNNING MULTICAST MIU:1500 跃 点 数 :1 

接收 数据 包 :38756 错误 :0 丢弃 :0 过 载 :0 帧 数 :0 

发 送 数据 包 :6106 错误 :0 丢弃 :0 过 载 :0 载波 :0 

碰撞 :0 发 送 队列 长 度 :1000 

接收 字 节 :54579596 (54.5 MB) 发 送 字 节 :383666 (383.6 KB) 


lo Link encap: 本 地 环 回 
inet 地 址 :127.0.0.1 掩 码 :255.0.0.0 
inet6 地 址 : ::1/128 Scope:Host 
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UP IOOPRACK RUNNING MIU:65536 EKA% :1 

接收 数据 包 :102 错误 :0 丢弃 :0 过 载 :0 帧 数 :0 

发 送 数据 包 :102 错误 :0 丢弃 :0 过 载 :0 载波 :0 

碰撞 :0 发 送 队列 长 度 :1000 

接收 字 节 :9515 (9.5 KB) 发 送 字 节 :9515 (9.5 KB) 

root@ubuntu:~ # ifoonfig enp0s3 down 

SIOCSIFFI2GS: 不 允许 的 操作 

root@ubuntu:~ # sudo ifconfig enp0s3 down 

[sudo] root 的 密码 : 

root@ubuntu:~ # sudo ifconfig enp0s3 up 

以 上 命令 首先 显示 了 当前 系统 的 网 卡 信息 ,可 以 看 到 网 卡 名 称 为 enp0s3。 第 二 条 命 
令 将 该 网 卡 关闭 ,要 执行 这 一 命令 ,命令 使 用 者 必须 为 超级 用 户 , 因 此 第 一 次 执行 不 成 功 ， 
第 二 次 以 root 身份 执行 成 功 。 最 后 一 条 命令 将 该 网 卡 打开 。 用 ifconfig 命令 配置 的 网 卡 
信息 ,在 网 卡 重启 后 或 机 器 重启 后 不 存在 。 要 想 将 上 述 的 配置 信息 永远 地 存在 计算 机 里 ， 
那 就 要 修改 网 卡 的 配置 文件 了 。 

3. wget 

wget 是 一 个 非常 有 用 的 GNU 命令 行 工 具 , 用 于 从 互联 网 上 下 载 文件 。 它 对 于 
Linux 用 户 是 必 不 可 少 的 工具 。wget 命令 格式 为 : 


wget [选项 ] [URL 地 址 ] 
例如 : 
wget http://ww.centos.bz/download?id= 1 


wget 功能 完善 ,支持 断 点 下 载 功能 ,同时 支持 FTP 和 HTTP 下 载 方式 ,支持 代理 服 
务 器 和 设置 起 来 方便 简单 ,并 且 它 运行 于 后 台 , 可 用 于 脚本 和 cron 作业 。 

4. scp 

scp 是 secure copy 的 简写 ,是 Linux 系统 下 基于 ssh 登录 进行 安全 的 远程 文件 复制 
命令 ,可 以 在 Linux 服务 器 之 间 复 制 文件 和 目录 。scp 命令 使 用 格式 为 : 

sco [参数 ] [ 原 路 径 ] [目标 路 径 ] 

scp 命令 和 cp 命令 相似 ,不 过 cp 命令 不 能 跨 主机 拷贝 ,而且 scp 传输 是 加 密 的 。 当 
服务 器 硬盘 变 为 只 读 (Cread only system) 时 ,用 scp 可 以 帮 用 户 把 文件 移出 来 。 
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1. top 

top 命令 是 Linux 中 常用 的 性 能 分 析 工 具 , 能 够 实时 显示 系统 中 各 个 进程 的 资源 占 
用 状况 ,包括 进程 ID ,内存 占用 率 `.CPU 占用 率 等 ,类 似 于 Windows 的 任务 管理 器 ,提供 
了 实时 地 对 系统 处 理 器 的 状态 监视 。top 命令 格式 为 : 

top [选项 ] 


top 将 显示 系统 中 CPU 最 ”敏感 ”的 任务 列表 。 该 命令 可 以 按 CPU 使 用 、 内 存 使 用 
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和 执行 时 间 对 任务 进行 排序 ,并 且 该 命令 的 很 多 特性 都 可 以 通过 交互 式 命令 或 者 在 个 人 
定制 文件 中 进行 设 定 。 

2. iostat 

iostat 是 I/O statistics 的 缩写 ,这 一 工具 将 对 系统 的 磁盘 操作 活动 进行 监视 。 使 用 
格式 为 : 


iostat[ 选 项 ] [时间] 次数 ] 


通过 iostat 可 以 方便 地 查看 CPU、 网 卡 .TTY 设备 \ 磁 盘 \CD-ROM 等 设备 的 活动 情 
况 、 负 载 信 息 。 

3. sar 

sar 是 系统 活动 情况 报告 (System Activity Reporter) fI fij 43 ,是 目前 Linux 中 最 为 全 
面 的 系统 性 能 分 析 工 具 之 一 ,可 以 从 多 方面 对 系统 的 活动 进行 报告 ,包括 文件 的 读 写 情 
况 .系统 调用 的 使 用 情况 、 磁 盘 T/O CPU 效率 、 内 存 使 用 状况 、 进 程 活动 及 IPC 有 关 的 活 
动 等 。 使 用 的 格式 为 : 


sar [选项 ] [-A] Co 文件 名 ] 采样 间隔 [采样 次 数 ] 


其 中 : -o 文 件 名 表示 将 命令 结果 以 二 进 制 格式 存放 在 指定 的 文件 中 ;采样 次 数 默 认 
值 为 1 。 

4. free 

在 Linux 系统 的 监控 工具 中 ,free 是 最 经 常 使 用 的 命令 之 一 。free 命令 显示 系统 使 
用 和 空闲 的 内 存 情况 ,包括 物理 内 存 、 交 互 区 内 存 (swap) 和 内 核 缓 冲 区 内 存 。 命 令 格 
RH: 


fre [SU] 
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Linux 系统 的 命令 众多 ,由 于 兴趣 点 或 研究 内 容 不 同 ,每 个 用 户 经 常 使 用 的 命令 也 有 
所 不 同 。 为 了 便于 顺利 阅读 本 书后 面 的 章节 , 表 1.1.28 1.2 和 表 1. 3 列 出 一 些 绝 大 部 分 
用 户 都 经 常 使 用 的 命令 ,并 对 命令 的 功能 进行 简单 的 描述 。 如 果 需 要 了 解 命令 的 详细 情 
况 、 使 用 方法 及 参数 的 选择 ,可 以 在 man 手册 的 第 1 章 进行 查询 ,例如 想 了 解 adduser 命 
令 的 使 用 方法 ,可 以 在 Shell 中 输入 man 1 adduser。 


表 1.1 常用 系统 命令 及 其 功能 描述 


命令 名 称 功能 描述 
login 在 系统 中 建立 一 个 新 的 会 话 

shutdown 暂停 ,关闭 或 重启 系统 

hostname 修改 或 查看 主机 名 

uname 显示 系统 及 版 本 信息 


ET 


e^ 


续 表 


功能 描述 


检查 磁盘 空间 占用 情况 


显示 当前 系统 所 登录 的 用 户 以 及 所 登录 的 控制 台 


adduser 


在 系统 中 添加 一 个 新 的 用 户 或 组 


passwd 


所 有 用 户 都 可 用 此 命令 来 修改 账户 密码 ,超级 用 户 可 以 更 改 任 一 账户 的 密码 


更 改 用 户 ID 或 成 为 超级 用 户 


以 其 他 用 户 的 身份 执行 命令 ,默认 为 root 用 户 


表 1.2 常用 基本 命令 及 其 功能 描述 
功能 描述 


退出 当前 的 Shell 


清 屏 


显示 文件 或 目录 及 其 属性 


进入 指定 的 目录 


显示 当前 工作 目录 的 绝对 路 径 名 


创建 目录 文件 


删除 空 的 目录 文件 


创建 文件 或 修改 文件 的 时 间 属 性 


查看 文件 内 容 ,类似 命 令 还 有 more. less, head \tail 等 


删除 文件 ,rm -r dir 表示 递归 方式 删除 非 空 目 录 dir 


移动 文件 或 改动 文件 名 称 


文件 重 命名 ,可 以 用 于 改变 一 批文 件 的 名 称 


复制 文件 


在 一 个 目录 结构 中 查找 文件 ,类 似 命令 有 locate 


显示 包含 模式 串 的 这 行内 容 


建立 链接 文件 ,-s 选项 表示 建立 符号 连接 


统计 指定 文件 的 行 数 、 单 词 数 和 字符 数 


cmp 


逐 位 比较 两 个 文件 


diff 


逐 行 比较 两 个 文件 


chmod 


修改 文件 的 访问 权限 


umask 


设置 创建 文件 时 的 权限 掩 码 


mount 


加 载 文件 系统 


umount 


[E pa E 
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表 1.3 其 他 常用 命令 及 其 功能 描述 


命令 名 称 功能 描述 命令 名 称 功能 描述 

ps 显示 进程 信息 (命令 执行 时 的 快照 ) mail 发 送 邮件 

kill 向 指定 进程 发 送 一 个 信号 date | 显示 或 设置 系统 的 日 期 和 时 间 
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Linux 系统 功能 强大 ,命令 众多 ,大 部 分 的 应 用 程序 都 是 以 自由 软件 形式 提交 的 , 因 
此 在 使 用 过 程 中 遇 到 的 问题 很 多 时 候 需 要 靠 使 用 者 自己 解决 。 作 为 Linux 系统 编程 的 初 
学 者 ,学 会 使 用 帮助 是 很 重要 的 。 在 Linux 系统 中 提供 了 UNIX 在 线 系统 手册 .GNU 的 
超 文本 帮助 系统 .help 命令 等 帮助 ,在 编写 程序 时 ,还 可 以 通过 获取 错误 代码 来 分 析 发 生 
了 什么 问题 。 

1. 在 线 系统 手册 一 一 man 

man 手册 是 UNIX 系统 手册 的 电子 版 本 ,该 手册 中 记录 了 类 UNIX 系统 中 大 部 分 命 
令 、 函 数 、 系 统 调用 的 说 明 , 也 包括 类 UNIX 系统 的 其 他 说 明 。 使 用 类 UNIX 系统 时 都 可 
以 参考 该 手册 。 在 man 手册 中 ,根据 不 同 的 主题 将 内 容 划分 为 不 同 的 章节 ,各 章节 内 容 
如 下 : 

。 第 1 章 标 准 命令 (Standard commands) 

。 第 2 章 系 统 调用 (System calls) 。 

。 第 3 WEE PR CLibrary functions). 

。 第 4 章 设备 说 明 (Special devices) 。 

。 第 5 章 文件 格式 (File formats) 。 

。 第 6 章 游 戏 和 娱乐 (Games and toys) 。 

。 第 7 章 杂 项 (Miscellaneous)。 

。 第 8 章 管理 员 命 令 (Administrative Commands) 。 

。 第 9 章 其 他 Linux 特定 的 ,用 来 存放 内 核 例 行 程序 的 文档 。 

使 用 man 手册 时 ,命令 格式 如 下 : 


man[ 选 项 ] 章节 ] 手册 页 
例如 : 


men 3 rename 


表示 在 man 手册 的 第 3 章 中 查找 rename 的 手册 页 。 

2. GUN 的 超 文本 帮助 系统 一 一 info 

info 是 GNU 的 超 文本 帮助 系统 , 它 可 以 在 命令 行 模式 下 通过 键入 info 打开 ,也 可 以 
在 Emacs 中 键入 Esc-x info 打开 。info 的 使 用 格式 为 : 


info[ 选 项 ] [参数 ] 
其 中 参数 可 以 是 需要 获得 帮助 的 主题 .也 可 以 是 指令 、 函 数 以 及 配置 文件 ;常用 的 选项 有 : 
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。-d: 添加 包含 info 格式 帮助 文档 的 目录 。 

* f: 指定 要 读 取 的 info 格式 的 帮助 文档 。 
。-n: 指定 首先 访问 的 info 帮助 文件 的 结 点 。 
* -o: 输出 被 选择 的 结 点 内 容 到 指定 文件 中 。 
例如 : 


info info 
3. 查阅 内 部 命令 一 一 help 
在 Linux 系统 中 ,有 一 些 命令 使 用 man 手册 是 无 法 查 到 的 ,这 些 命令 属于 系统 内 部 
命令 (如 cd 命令 ) ,此 时 可 以 使 用 help 命令 列 出 系统 各 种 的 内 部 命令 。 
在 Shell 环境 中 输入 help 命令 ,系统 将 列 出 当前 的 所 有 内 部 命令 如 下 : 


GNU bash, 版 本 4.3.48(1)- release (i686- pc- linux- gnu) 

这 些 shell 命令 是 内 部 定义 的 。 请 输入 "help' 以 获取 一 个 列表 。 
输入 "help 名 称 ' 以 得 到 有 关 函 数 ' 名 称 ' 的 更 多 信息 。 

使 用 'info bash' 来 获得 关于 shell 的 更 多 一 般 性 信息 。 

使 用 "man -k' 或 'info' 来 获取 不 在 列表 中 的 命令 的 更 多 信息 。 


名 称 旁边 的 星 号 (* ) 表 示 该 命令 被 禁用 。 


jæ spec [4] history [- c] [-d 偏 移 量 ] [n] SX history > 
(( 表 达 式 )) 迁 命令 ; thn 命令 ; [ elif 命令 ; then 命令; > 


.文件 名 [参数 ] jdbs [- lnprs] [任务 声明 .…] 或 jcbs -x 命 > 
: xil [-s 信 号 声明 | -n 信 号 编号 | -信号 声明 ] 进程 号 


> 


[参数 .…] lec 参数 [参数 ..] 

[[ 表 达 式 ]] local [option] 名 称 仁 值 ].… 

alias [-p] UAR [fL] …] logout [n] 

bg [任务 声明 .…] mapfile [-n 计 数 ] Co 起 始 序号 ] [-s 计 数 ] [-> 
bind [- lpsvPSVX] [-m keymep] [- f file» popd [-n] [+ N | - N] 

break [n] printf [-v var] 格式 [参数 ] 

builtin [shell 内 建 [参数 .J] — pushd [-n] H N | -NI 目录 ] 

caller [表达 式 ] ped [- LP] 


case iH] in WR [| 模式 ]..) 命令 ;;] .…es> reed [-ers] Ca 数组 ] Ca 分 隔 符 ] [-i 缓冲 区 > 
ca [- LI [- P [- e]] Ce]] [dir] readarray [- n iC]. [-o 起 始 序号 ] Cs 计数 ] > 

omand [-pwv] 命令 人 参数 ..] readonly [- anf] [名 称 仁 值 ] .…] 或 reado> 

capan [-abodefgjksuv] [-o 选 项 ] [-A> retum [n] 

complete [- abodefgjksuv] [-pr] [-IE] > select NME [in 词语 …;] do 命令 ; dor» 

cmpopt [-o|* o 选 项 ] HE 咯 称 Jst [- - abefhkmpbzzBcHP] [-o 选 项 名 ] [> 

continue [n] shift [n] 

coproc [名 称 ] 命令 [ 重 定 向 ] shopt [-pqsu] [-0] [选项 名 .…] 

declare [-aAfFgilnrtux] [-p] [name[- v» source 文件 名 参数] 

dirs [- clgv] [+ N] [-N] suspend [- £] 
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dison [-h] [-ar] [任务 声明 ..] test [表达 式 ] 


echo [- ne&] [参数 ..] time [-p] 管道 

enable [-a] [-dnps] [-f 文 件 名 ] [名 称 .…]> times 

eval [参数 .…] trap [- 10] [R] 信号 声明 .…] 

exec [-cl] [-a AA PR] [命令 参数 .…]] [ 重 定向 >tme 

exit [n] type [- afptP] 名 称 [名 称 .…] 
export. [-fn] AF EI] ] 或 export -p> typeset [-aAfrgilram] [-p] 名 称 与 值 ].> 

false ulimit [- SHabodefilmpqrstuvxT] [lim 
fc [- e AER] [ Inr] 起 始 ] [E45] foc-s wask [-p] LS] RR] 

fg [任务 声明 ] unalias [-a] 名 称 [名 称 .…] 

for 名 称 [in 词语 …] ; db 命令 ; done unset [- f£] [- v] [7n] [name ..] 

for (RER 1; 表达 式 2; 表达 式 3 )); do 命令 ; do»until 命令 ; do 命令 ; done 

function 名 称 { 命令 ; ) 或 name Q {命令 ;> variables -一 些 shell 变量 的 名 称 和 含义 
getopts 选项 字符 串 名 称 [参数 ] wait [-n] [id ..] 

hash [-1r] [-p BEES 4] [- dc] [名 称 .…] while 命令 ; do 命令 ; done 

help [- dms] 噶 式 ..] { 命令 i) 


4. 获取 错误 信息 一 一 errno 
在 Linux 环境 中 编写 的 程序 ,调试 或 运行 时 如 果 遇 到 出 错 的 情况 ,此 时 获取 错误 信息 


对 于 修改 程序 就 格外 重要 。 在 系统 编程 中 ,会 大 量 地 使 用 系统 调用 和 库 函 数 ,这 些 系 统 调 
用 和 库 函 数 在 调用 后 根据 执行 情况 会 返回 执行 成 功 与 否 的 信息 ,通常 返回 0 表示 执行 正 
确 , 一 1 表示 错误 ,并 且 把 错误 编号 记录 在 errno 中 。 


errno 是 一 个 系统 全 局 变量 , 它 记 录 了 调用 库 函 数 或 系统 调用 后 的 错误 代码 ,其 错误 


代码 的 含义 定义 在 /usr/include/asm-generic 目录 下 的 errno-base. h 和 errno. h 中 (作者 
使 用 的 环境 为 Ubuntu, 不 同 平 台中 的 头 文件 位 置 不 同 ) 。 


与 此 同时 ,系统 还 提供 一 个 库 函 数 perror 来 解读 errno 错误 代码 的 含义 ,该 函数 声明 


于 /usrinclude/stdio. h 中 ,原型 如 表 1.4 所 示 。 


表 1.4 perror 函数 的 接口 规范 说 明 


函数 名 称 perror 

功能 显示 当前 errno 所 对 应 的 错误 信息 
头 文件 # include<stdio. h> 

函数 原型 extern void perror(const char *s) ; 
参数 s 提示 信息 的 标题 

返回 值 无 


perror 函数 根据 当前 errno 的 值 获得 与 错误 对 应 的 描述 字符 串 , 将 错误 信息 显示 在 


标准 错误 设备 上 ,并 且 在 错误 信息 前 加 上 参数 s 中 的 字符 串 作 为 错误 信息 的 标题 。 这 样 
一 来 ,程序 编写 者 可 以 将 所 使 用 的 库 函 数 或 系统 调用 名 作为 perror 函数 的 参数 ,出 错时 
就 可 以 明确 ,是 哪个 函数 出 了 什么 样 的 错误 。 
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除了 perror 函数 外 ,strerror 也 可 以 单纯 地 将 错误 标号 转 为 描述 错误 的 字符 串 。 该 
函数 声明 于 /usr/include/string. h 中 ,原型 如 表 1. 5 所 示 。 


表 1.5 strerror 函数 的 接口 规范 说 明 


函数 名 称 strerror 

功能 显示 指定 错误 号 对 应 的 错误 信息 
头 文件 & include string. h> 

函数 原型 char* strerror(int errnum) ; 
参数 errnum 错误 号 

sn ritui inm 


perror PAIR strerror 函数 两 者 不 同 之 处 在 于 : 

第 一 ,perror 是 隐 式 地 使 用 全 局 变量 errno;strerror 并 没有 将 参数 局 限 为 errno, 实 际 
上 可 以 将 任何 一 个 合理 的 整 型 数据 作为 strerror 的 参数 。 

第 二 ,perror 除了 显示 错误 的 文本 描述 外 ,还 可 以 由 程序 设计 者 指定 一 部 分 显示 的 信 
息 ;strerror 调用 后 只 返回 相关 的 错误 文本 信息 。 


1.4 小 结 


本 章 是 对 Linux 基础 知识 的 概述 ,包括 了 解 Linux 的 发 展 ,理解 Linux 的 一 些 关键 概 
念 ,Linux 内 核 , 内 核 态 和 用 户 态 、 内 核 版 本 编号 规则 和 常见 发 行 版 本 。 本 章 还 介绍 了 
Linux 系统 编程 的 概念 、 学 习 内 容 和 方法 ,并 且 通 过 ls 的 例子 ,体会 学 习 系 统 编程 的 几 个 
步骤。 另外 对 系统 编程 中 频繁 出 现 的 重要 概念 一 一 系统 调用 和 库 函 数 ,进行 了 对 比 介 绍 。 
最 后 介绍 了 Linux 环境 下 常用 的 工具 和 命令 。 


习 题 


— JR S 

1. 要 设置 /test/a. txt 文件 的 属 主 具 有 读 、 写 ,执行 权限 , 同 组 用 户 具 有 读 、 写 权限 ,其 
他 用 户 无 权限 ,命令 为 

2. 要 删除 /tmp 下 所 有 A 开 闷 的 文件 可 使 用 命令 è 

3. 要 将 /tmp/etc/text. txt 移动 到 /tmp 下 并 改名 为 test. txt, 可 使 用 命 


a 


. Linux 系统 中 /var 目录 中 一 般 存放 的 是 文件 。 
. 在 Linux 系统 中 ,“. "Aog O STU XR 
. 想 要 将 /home/usera 的 所 有 文件 打包 ,可 使 用 命令 
. umount 命令 可 以 用 来 e 


Amos 
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8. 一 些 命令 需要 以 超级 用 户 的 身份 来 执行 ,此 时 可 以 在 要 执行 的 命令 前 加 命 
二 、 简 答 
1. 写 出 你 所 装 系统 的 商业 版 本 和 内 核 版 本 , 列 出 /目录 下 第 一 级 目录 及 文件 的 名 称 
和 大 致 说 明 。 

2. 请 简 述 库 函数 和 系统 调用 的 区 别 。 

3. Linux Shell 环境 中 查看 文本 文件 内 容 可 以 使 用 哪些 命令 ,这 些 命令 有 什么 差异 ? 

4. 使 用 Linux 操作 系统 时 ,可 以 使 用 哪些 方式 获取 帮助 ? 

三 、 编程 题 

1. 用 strerror PRAISE IE perror 函数 的 功能 。 

2. 请 调试 1. 2. 3 节 中 的 示例 程序 1. 1。 


令 
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Linux 支持 多 种 高 级 语言 ,C 语言 是 Linux 中 最 常用 的 系统 编程 语言 之 一 ,Linux 内 
核 绝 大 部 分 代码 也 是 用 C 语言 编写 的 ,Linux 平台 上 有 相当 多 的 应 用 程序 也 是 用 C 语言 
开发 的 。 一 个 程序 的 开发 过 程 中 ,会 涉及 源 代码 的 编辑 、 编 译 与 调试 过 程 。 本 章 将 会 介绍 
Linux 中 广泛 使 用 且 支 持 C 语言 的 编辑 器 工具 vim、 编 译 工 具 gee 和 make、 调 试 工具 
gdb。 通 过 对 这 些 工具 使 用 方法 的 详细 介绍 ,读者 可 以 掌握 如 何在 Linux 下 进行 C 语言 
开发 的 过 程 以 及 使 用 这 些 工 具 的 一 些 技巧 。 


2.1 编辑 工具 
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与 Windows 系统 不 同 , 在 Linux 系统 中 ,服务 和 系统 的 设置 都 保存 在 文本 文件 中 ,要 
进行 某 个 设置 时 ,需要 文本 编辑 器 修改 文本 文件 中 的 设置 ; 当 用 户 在 Linux 下 编写 C 语 
言 程序 或 Shell( 或 Perl) 脚 本 时 ,也 会 需要 使 用 文本 编辑 器 。 这 些 文本 编辑 器 称 为 编辑 
工具 。 

目前 可 在 Linux 下 使 用 的 编辑 工具 种 类 非常 多 ,下 面 介 绍 Linux 中 比较 受 欢 迎 的 一 
些 编辑 工具 。 

l. vi 编辑 器 

vi 编辑 器 是 许多 UNIX, Linux 系统 默认 安装 的 文本 编辑 器 ,几乎 所 有 的 发 行 版 都 预 
装 了 vi 编辑 器 , 它 诞生 于 20 世纪 70 年 代 , 从 诞生 至 今 虽然 已 经 接近 半 个 世纪 ,然而 其 小 
巧 的 体积 和 强大 的 功能 ,使 其 到 现在 为 止 仍 有 许多 忠实 的 用 户 ,在 一 些小 型 系统 上 或 一 些 
竺 殊 情况 下 ,vi 编辑 器 可 能 是 唯一 能 使 用 的 文本 编辑 器 。 能 够 熟练 使 用 vi 编辑 器 已 经 成 
为 Linux 系统 的 一 项 基本 技能 。 

2. vim 编辑 器 

vim 是 vi 编辑 器 的 增强 版 ,由 Bram Moolenaar 在 20 世纪 80 年 代 末 开发 出 了 第 一 个 
版 本 ,除了 能 完全 兼容 vi 编辑 器 之 外 ,还 添加 了 许多 新 的 功能 。 它 们 都 是 多 模式 编辑 器 ， 
不 同 的 是 vim 是 vi 的 升级 版 本 , 它 不 仅 兼容 vi 的 所 有 指令 ,而 且 还 有 一 些 新 的 特性 在 里 
面 。 比 如 vim 支持 多 级 撤销 ,在 vi 中 , 按 u 只 能 撤销 上 次 命令 ,而 在 vim 里 可 以 无 限制 地 
撤销 ;具有 更 易 用 性 ,vi 只 能 运行 于 Unix 和 Linux 中 ,而 vim 可 以 运行 于 Unix, Linux, 
Windows, Mac 等 多 操作 平台 ;支持 语法 加 亮 功能 ,vim 可 以 用 不 同 的 颜色 来 加 亮 程序 代码 : 
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因此 相 比 vi 来 说 ,vim 更 适合 编程 工作 人 员 使 用 ,而 vi 更 适合 文本 编辑 。 

3. Emacs 编辑 器 

Emacs 是 Editor MACroS( 编 辑 宏 ) 的 缩写 ,诞生 于 1975 年 (时 间 早 于 vi 编辑 器 ) ,最 
初 是 由 Richard Stallman 5j Guy Steele 在 MIT( 麻 省 理工 学 院 人 工 智 能 实验 室 ) 共 同 编 
写 的 。 随 着 Emacs 的 逐步 完善 ,其 已 经 成 为 开源 操作 系统 Linux 中 唯一 能 与 vim 编辑 器 
抗衡 的 文本 编辑 器 。 与 vim 相 比 ,Emacs 一 样 十 分 强大 ,几乎 可 以 完成 所 有 可 以 想象 到 
的 任务 。 也 正 因为 如 此 ,在 互联 网 上 甚至 引发 了 vim 与 Emacs 之 争 。 

安装 了 Emacs 后 ,在 Shell 提示 符 下 输入 : 


root@ubuntu:~ # emacs demol 


即 可 以 打开 如 图 2. 1 所 示 的 Emacs 编辑 器 编辑 界面 ,在 此 界面 中 ,可 以 将 Emacs 作为 一 
个 文本 编辑 器 ,输入 文本 信息 。 同 样 , Emacs 编辑 器 也 支持 很 多 编辑 命令 , 表 2. 1 列 出 了 
部 分 常用 基本 命令 。 


#include <stdio.h> 
int main() 

t 
Iprintf("hello world'in"); 
return 0; 

) 


图 2.1 Emacs 编辑 器 编辑 界面 
表 2.1 Emacs 常用 基本 命令 


*$ 令 * X 
C-h 进入 在 线 辅助 说 明 系统 
Cx Cs 存盘 
Cx Ce 跳出 Emacs 
Cx u 恢复 前 一 次 的 动作 (可 重复 使 用 ) 
C-g 跳出 目前 的 命令 
Cn Cf Cb Cp 前 进 /后 退 一 字符 /一 行 
Mv Cs 查找 字符 串 
C-d 删除 一 个 字符 


Se 
ad 
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Emacs 特别 适合 编辑 程序 ,包括 任何 类 型 的 计算 机 语言 程序 。 它 提供 了 语法 加 亮 、 自 
动 缩 进 等 功能 。 一 些 扩 展 命令 可 以 让 用 户 很 方便 浏览 代码 ,它们 可 以 识别 代码 的 语义 , 列 
出 函数 名 、 函 数 的 参数 和 类 型 .变量 名 、 类 、 宏 、 方 法 、define 和 include 文件 。 编 辑 程序 时 ， 
Emacs 可 提供 补 全 函数 名 、 参 数 等 功能 。 

4. Nano 编辑 器 

在 Linux 系统 中 ,除了 vi, vim, Emacs 等 文本 编辑 器 外 ,还 存在 一 些 很 有 特色 的 文本 
编辑 器 ,Nano 就 是 其 中 一 种 。 

Nano 是 一 个 类 UNIX 系统 中 使 用 的 文本 编辑 器 。 与 其 他 文本 编辑 器 相 比 ,Nano 没 
有 华丽 的 界面 ,也 没有 众多 复杂 的 模式 和 快捷 键 。 但 Nano 却 拥 有 最 简便 的 操作 ,编辑 简 
单 文本 时 ,效率 非常 高 ,非常 适合 初学 者 使 用 。 

Nano 于 1999 年 首次 发 布 ,属于 GNU 工程 的 一 部 分 ,并 使 用 GPL 作为 其 许可 证 。 关 于 
Nano 的 更 多 内 容 , 感 兴趣 的 读者 可 查看 其 官方 网 址 : https://www. nano-editor. org/ 。 

在 Shell 提示 符 下 输入 以 下 命令 ,其 中 demo_nano 是 要 编辑 的 文件 名 。 


root8ubuntu:^ # nano dero nano 


即 可 以 打开 如 图 2. 2 所 示 的 Nano 编辑 器 编辑 界面 ,在 此 界面 中 ,可 以 将 Nano 作为 
一 个 文本 编辑 器 ,输入 文本 信息 。 同 样 ,Nano 编辑 器 也 支持 很 多 编辑 命令 , 表 2.2 列 出 了 
部 分 常用 基本 命令 。 


E 求助 E RA E 读 档 Tm E Nux & 游标 位 置 


图 2.2 Nano 编辑 器 编辑 界面 


表 2.2 Nano 常用 基本 命令 


命 令 含 x 
Ctrl+G 或 Fl 打开 编辑 器 帮助 界面 
Ctrl 十 X 退出 当前 编辑 界面 ,如 果 没 存盘 ,提示 存盘 
Ctrl+Y Ctrl 二 V 向 上 翻 页 ,向 下 翻 页 
Ctrl+P Ctrt+N 向 上 翻 一 行 、 向 下 翻 一 行 
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*$ 令 & x 
Alt+6 将 当前 光标 所 在 行 复制 到 缓冲 区 中 
Ctrl 十 有 将 光标 所 在 行 剪 切 到 缓冲 区 内 
Ctrl+U 将 缓冲 区 中 内 容 粘 贴 到 光标 所 在 位 置 
Ctrl - W Nano 会 提示 用 户 输入 要 查找 的 文本 
Ctrl 十 \ Nano 会 提示 用 户 输 入 要 查找 的 文本 和 替换 的 文本 


提示 : 快捷 显示 栏 中 的 ^ 表 示 键 盘 上 的 Ctrl 键 , 例 如 ^G 表示 快捷 键 Ctrl 十 G。 

5. Gedit 编辑 器 

使 用 Gnome 桌面 环境 的 Linux 发 行 版 中 ,通常 都 装 有 一 个 图 形 化 的 文本 编辑 器 
Gedit。 虽 然 Gedit 编辑 器 被 默认 安装 在 系统 中 ,但 大 多 数 人 仅 用 到 了 其 基本 功能 ,Gedit 
除了 最 简单 的 文本 编辑 外 ,还 可 以 自动 备份 文本 、 用 来 进行 各 种 语言 编程 等 。 

Gedit 文本 编辑 器 的 工作 界面 与 Windows 系统 中 文本 编辑 软件 类 似 , 使 用 很 方便 。 
与 Windows 系统 中 的 文本 编辑 器 记事 本 不 同 ,Gedit 可 以 在 窗口 通过 切换 标签 的 方式 同 
时 编辑 多 个 文本 。 

对 于 用 户 而 言 ,Gedit 文本 编辑 器 有 许多 好 处 。 

。 兼容 UTF-8 等 多 种 编码 模式 ,能 够 很 好 地 支持 多 种 语言 。 
可 以 设置 多 种 编程 语言 语法 高 亮 。 
支持 打印 和 打印 预览 功能 。 
支持 文本 自动 缩 进 功能 。 

。 支持 显示 行 号 。 

。 支持 拼写 检查 。 

在 Gnome 桌面 环境 中 ,依次 单 击 桌面 左上 角 Applications Accessories — Text 
Editor, 即 可 启动 Edit 文本 编辑 器 ,如 图 2. 3 所 示 。 

关于 Gedit 文本 编辑 器 的 更 多 内 容 , 感 兴趣 的 读者 可 以 查阅 其 官方 网 站 了 解 : 
http://projects. gnome. org/gedit/ 。 
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vi 是 所 有 Linux 系统 都 提供 的 一 款 编辑 器 , 某 些 版 本 的 Linux 还 提供 了 vi 的 增强 
版 vim, ÈS vi 完全 兼容 ,vi 和 vim 的 存放 路 径 为 /usr/bin。vim 软件 及 有 关 信 息 可 
以 从 www. vim. org 获得 ,本 节 详 细 讲解 vi/vim 的 使 用 。vi 是 一 款 比 较 古 老 的 编辑 器 ,是 
字符 界面 的 编辑 器 。 现 代 图 形 编辑 器 种 类 繁多 ,各 种 “所 见 即 所 得 ”的 IDE 使 编程 更 方 
便 ,为 什么 我 们 还 需要 介绍 vi/vim 编辑 器 呢 ? 因为 IDE 的 便捷 性 是 需要 代价 的 ,需要 后 
台 图 形 引擎 的 支持 ,如 果 系 统 中 没有 图 形 库 , 则 无 法 使 用 IDE; 另 一 个 原因 是 有 太 多 
Linux 命令 都 是 默认 使 用 vi 作为 数据 编辑 的 接口 ,所 以 建议 读者 学 会 使 用 vi, 否 则 很 多 命 
令 根本 无 法 操作 。vi 虽然 不 易学 习 , 但 它 有 强大 的 功能 和 高 度 灵活 性 ,与 操作 系统 的 兼 
容 性 最 好 ,是 目前 UNIX 类 操作 系统 使 用 人 数 最 多 的 文本 编辑 器 。 
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Gedit 
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图 2.3 Gedit 编辑 器 编辑 界面 


Linux 各 种 版 本 都 默认 安装 了 vi 的 原始 版 本 ,目前 大 部 分 发 行 版 都 以 vim 替代 vi 的 
功能 了 。 如 果 使 用 vi 后 ,看 到 界面 的 右 下 角 有 显示 目前 光标 所 在 的 行列 号 码 , 这 意味 着 
vi 已 经 被 vim 所 替代 了 。 为 什么 要 用 vim 呢 ? 因为 vim 具有 颜色 显示 的 功能 ,并 且 还 支 
持 许多 的 程序 语法 ,因此 , 当 用 vim 编辑 程序 时 (C 语言 或 Shell script) ,vim 可 以 帮助 用 
户 直接 进行 程序 除 错 (debug) 的 功能 。 

如 果 需 要 使 用 vim, 可 以 通过 如 下 命令 来 实现 vim 的 安装 。 


root@ubuntu:~ # apt- get install vim 


vim 是 一 款 字 符 界面 的 编辑 器 ,只 能 支持 键盘 操作 ,在 终端 中 输入 vim [文件 名 ], 启 
动 vim 程序 ,具体 命令 如 下 所 示 : 


root@ubuntu:~ # vim test.c 


进入 vim 初始 界面 ,如 图 2.4(a) 和 图 2. 4(b) 所 示 。 

vim 是 字符 界面 ,在 这 个 界面 上 为 用 户 提供 浏览 、 编 辑 文本 ,以 及 对 文本 进行 存盘 等 
功能 ,因此 vim 通过 三 种 模式 来 分 别提 供 这些 功 能 ,需要 时 用 户 可 以 切换 到 合适 的 模式 ， 
完成 需要 的 功能 。vim 的 三 种 模式 分 别 是 一 般 模 式 、 编 辑 模式 与 命令 模式 。 这 三 种 模式 
的 作用 分 别 如 下 。 

(1) 一 般 模 式 : 以 vim 打开 一 个 文件 就 直接 进入 一 般 模式 了 (默认 模式 )。 在 这 个 模 
式 中 ,读者 可 以 使 用 上 下 左右 按键 来 移动 光标 ,可 以 删除 字符 或 删除 整 行 ,也 可 以 复制 、 粘 
贴 文件 数据 。 

(2) 编辑 模式 : 在 一 般 模式 中 可 以 进行 删除 复制、 粘贴 等 操作 ,但 是 却 无 法 编辑 文 


mes [程序 开发 工具 " 


光标 在 这 里 


E 


ET —  iAgeRLRRÜREE 


这 里 显示 信息 或 进入 命令 行 模式 的 数据 


TITUDITUCEIEUUUUUUY 


test.c” [新 文件 ] 0,0-1 全 部 -| 
(a) 新 文件 


include <stdio.h> ^| 
ffinclude <sys/types.h> 

inclnde <unistd.h> 

ffinclude «signal.h» 

lfinciude «ctype.h» 


|fdefine MAX CHILD NUMBER 10 
[define SLEEP ; INTERVAL 5 
jint proc 1 number=0; 
oid do something(): 
Rain(int argc, chsr* argv[]) 
d 
int child proc number = MAX CHILD NUMBER; 
int i, ch; 
pid t child pid; 
pid t pid[1017(0);. 并 村 新 文件 ， 所 以 有 蜂 外 信息 


if (argc > 1) 


child prog/number- (child proc number > 10) ? 10 : child proc number; 


LEE 顶端 -| 


(b) 已 有 的 文件 
图 2.4 用 vim 打开 一 个 文件 


件 内 容 。 需 要 按 下 i、I、o、O、a、A、r、R 等 任何 一 个 字母 后 才能 进入 编辑 模式 。 通 常 在 
Linux 中 按 下 这 些 按键 时 ,界面 的 左下 方 会 出 现 INSERT 或 REPLACE 的 字样 ,此 时 才 
可 以 进行 编辑 ,而 如 果 要 回 到 一 般 模式 时 , 按 Esc 键 即 可 退出 编辑 模式 。 

(3) 命令 模式 : 在 一 般 模式 中 ,输入 “:”“/” 
“?” 三 个 中 的 任何 一 个 按键 ,就 可 以 将 光标 移动 到 
最 下 面 那 一 行 。 在 这 个 模式 当中 ,可 以 提供 读者 
查找 数据 的 操作 , 读 取 保存、 大 量 蔡 换 字符 、 离 开 
vim、 显 示 行 号 等 的 操作 也 是 在 此 模式 中 完成 的 。 

vim 的 三 种 模式 之 间 的 切换 操作 如 图 2. 5 


所 示 。 图 2.5 vim 的 三 种 模式 


一 般 模 式 
i、o、a( 插 入 ) Esc 键 
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注意 : 一 般 模式 与 编辑 模式 或 命令 模式 可 互相 切换 ,但 编辑 模式 与 命令 模式 间 不 可 
相互 切换 。 

1. 使 用 vim 创建 文件 

下 面 介绍 使 用 vim 创建 一 个 C 语言 源 程序 文件 hello. c 的 操作 步骤 。 

(1) 进入 vim 编辑 器 。 在 Linux Shell 中 输入 vim hello. c, 进 入 vim 编辑 器 的 一 般 模 式 。 

(2) 进入 编辑 模式 编辑 程序 。 在 vim 中 输入 i、1.o、O、a、A、r、R 等 任何 一 个 字母 后 才 
能 进入 编辑 模式 ,通常 按 i 键 ,之 后 可 以 编辑 程序 ,如 图 2.6 Bron o 


includecstdio.h» 
int main() 


printf("hello world!\n"); 
return 1;| 


图 2.6 vim 编辑 模式 编辑 代码 


(3) 存盘 退出 vim。 编 辑 完成 后 , 按 Esc 键 , 回 到 一 般 模式 ,再 按 下 “:”“/”“?” 三 个 中 
的 任何 一 个 按键 ,通常 按 ":” 键 进入 命令 模式 ,此 时 可 对 文件 进行 非 编辑 类 的 一 些 操作 ,如 
存盘 退出 vim。 

存盘 退出 vim 需要 输入 wq 命令 ,如 图 2.7 所 示 。 


Fincludecstdio.h» 
int main() 
{ 


printf("hello world'in"); 
return 1; 


图 2.7 vim 命令 模式 存盘 
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2. vim 常用 命令 汇总 
vim 常用 命令 如 表 2. 3 所 示 。 


表 2.3 vim 常用 命令 


$ Hu 


& x 


IW 


保存 当前 文件 


:w filename 


保存 当前 文件 (如 果 进 入 vim 时 没有 指定 要 编辑 的 文件 名 ,需要 在 保存 文件 时 加 上 
文件 名 filename, 如 果 进 入 vim 时 指定 了 文件 名 ,那么 该 用 法 相当 于 “另存 为 ”) 


退出 当前 正在 编辑 的 文件 


强制 退出 当前 正在 编辑 的 文件 并 放弃 最 近 一 次 保存 到 现在 的 所 有 操作 


保存 文件 并 退出 


撤销 最 近 一 次 操作 ( 按 Ctrl 十 R 组 合 键 恢复 撤销 的 操作 ) 


在 光标 所 在 的 位 置 前 面 插入 字符 


在 光标 所 在 的 位 置 后 面 插入 字符 


在 光标 所 在 行 的 下 一 行 插入 新 的 一 行 


在 光标 所 在 行 的 上 一 行 插入 新 的 一 行 


剪 切 光标 处 所 在 的 字符 (x 前 可 先 按 一 个 数字 , 则 剪 切 若干 个 字符 ) 


剪 切 光标 处 所 在 的 一 行 (dd 前 可 先 按 一 个 数字 , 则 剪 切 若干 行 ) 


复制 光标 处 所 在 的 一 行 (yy 前 可 先 按 一 个 数字 , 则 复制 若干 行 ) 


剪 切 从 光标 处 ( 含 ) 开 始 到 该 行 行 末 的 所 有 字符 


剪 切 从 光标 处 (不 含 ) 开 始 到 该 行 行 首 的 所 有 字符 


复制 从 光标 处 ( 含 ) 开 始 到 该 行 行 末 的 所 有 字符 


复制 从 光标 处 (不 含 ) 开 始 到 该 行 行 首 的 所 有 字符 


将 剪 切 板 中 的 资料 粘贴 到 光标 所 在 处 


修改 光标 所 在 的 字符 ,r 之 后 跟 要 修正 的 字符 (如 果 要 把 iut 中 的 u 改 为 n, 只 需 将 
光标 停 在 u 上 ,接着 连续 按 r 和 n 即 可 ) 


将 光标 向 前 移动 一 个 字符 


将 光标 向 下 移动 一 个 字符 


将 光标 向 上 移动 一 个 字符 


KL 小 写 ) 


将 光标 向 后 移动 一 个 字符 


gg 


跳 到 文本 的 最 初 一 行 


跳 到 文本 的 最 末 一 行 


Ctrl+U 


向 上 (up) 翻 页 


向 下 (down) 翻 页 
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$ WU * x 
: Vis/old/new 将 文件 中 所 有 的 old 字符 串 替换 成 new 
将 光标 处 往 下 查找 字符 串 string ,注意 在 输入 完 要 查找 的 字符 串 string 之 后 要 按 回 


续 表 


/string 车 键 。 如 果 要 找 的 字符 串 string 有 多 个 ,可 以 按 n 将 光标 跳 到 下 一 个 位 置 , 按 N 将 
光标 跳 到 上 一 个 位 置 。 
?string 跟 上 面 的 一 /string 之 是 一 样 的 ,区 别 是 它 从 光标 处 往 上 查找 。 
3. ctag 


很 多 时 候 , 需 要 在 多 个 程序 之 间 实 现 函 数 、 宏 定义 .外 部 变量 等 的 跳 转 查询 ,甚至 有 时 
需要 到 内 核 或 库 源 代码 里 窥视 它们 的 真面目 ,也 需要 有 列 出 程序 内 部 所 使 用 的 各 个 函数 、 
变量 、 宏 等 信息 的 工具 。 这 种 工具 类 似 Windows 下 的 SourceInsight。 这 些 功能 仅 靠 vim 
完成 是 比较 困难 的 ,以 下 介绍 的 两 种 工具 可 以 实现 上 述 功能 ,它们 分 别 是 ctag 和 Taglist。 

* ctag: 负责 建立 标签 ,为 实现 文本 间 关 键 词 实现 跳 转 提供 基础 。 

* Taglist: 是 一 个 vim 插件 ,帮助 罗列 程序 中 所 有 出 现 关键 词 的 地 方 。 

下 面 先 对 ctag 进行 详细 的 介绍 。 

下 载 ctag ,使 用 命令 如 下 : 


root@ubuntu:~ # apt- get. install ctags 
如 果 不 是 root 权限 的 用 户 ,请 使 用 如 下 命令 : 
root@ubuntu:~ # sudo apt- get install ctags 

如 果 系 统 提示 找 不 到 软件 包 ctags, 可 执行 命令 ， 


apt- get install exuberant- ctags 


sudo apt- get install exuberant- ctags 

下 载 完 毕 后 即 可 用 它 来 产生 标签 文件 tags 了 tags 文件 是 实现 跳 转 功能 的 关键 , 比 
如 读者 在 自己 的 程序 里 写 了 一 个 库 函 数 printf, 只 需 把 光标 停 在 printf 关键 词 上 ,再 按 下 
组 合 键 (Ctrl 十 ]) 会 跳 转 到 库 函 数 printf 的 源 代 码 的 地 方 , 按 下 组 合 键 (Ctrl 十 O) 就 可 以 
跳 回来 。 如 果 printf 是 库 函 数 对 一 个 系统 调用 的 封装 ,就 可 以 顺 着 tags 提供 的 路 径 跳 到 
内 核 去 查看 源 代码 是 怎么 写 的 ,如 果 是 两 层 以 上 的 封装 定义 ,也 可 以 一 次 次 跳 转 深入 其 
中 ,了 解 内 幕 。 

一 开始 ,需要 库 函数 的 源 代码 和 Linux 内 核 的 源 代 码 , 目 的 就 是 在 需要 时 可 以 跳 转 到 
这 些 地 方 的 某 些 文件 当中 查看 相关 的 资料 信息 ,有 了 ctags 工具 之 后 ,就 可 以 在 源 代码 的 
顶层 目录 处 执行 下 面 这 条 命令 : 


ctags -R 
例如 ,程序 的 库 路 径 是 一 /ownloads/glibc-2. 9, 那 么 代码 如 下 : 


cd ~ /ownloads/glibc- 2.9 


mes [程序 开 发 工具 ^. 
ctags -R 


命令 中 的 选项 -R 的 意思 是 ,递归 地 进入 当前 目录 下 的 所 有 子 目录 ,把 在 该 目录 下 的 所 
有 文件 的 关键 词 (包括 函数 名 、 宏 ,文件 名 等 关联 到 一 起 ,并 且 写 入 一 个 tags 文件 )。 当 然 , 如 
果 让 程序 中 的 函数 可 以 跳 转 到 内 核 ,那么 应 该 在 内 核 代码 的 顶层 目录 下 执行 以 上 命令 。 
然后 ,在 /etc/vim/vimrc 文件 末尾 ,添加 以 下 信息 : 


au BufEnter/hame/vincent/* setlocal tagst = /home/vincent/glibc- 2.9/tags 


注意 ,操作 时 要 把 上 面相 应 路 径 换 成 自己 计算 机 上 的 具体 路 径 。 其 中 /home/ 
vincent/ * 的 意思 是 : 在 该 路 径 下 的 所 有 文件 (通配符 * ) 都 可 以 通过 tags 文件 实现 跳 转 
(包括 子 目 录 ) ,而 这 个 tags 文件 ,就 是 由 后 面 这 个 路 径 /home/vincent/glibc-2. 9/tags 指 
定 的 。 

如 果 需 要 把 内 核 代 码 也 添加 进来 , 先 在 内 核 源 代码 顶层 目录 执行 指令 ctags -RR, 然 后 
在 /etc/vim/vimrc 文件 末尾 再 添加 一 句 话 即 可 ,添加 时 要 把 tags 所 在 的 路 径 蔡 换 成 内 核 源 
代码 的 路 径 。 例 如 ,添加 以 下 信息 (注意 /home/vincent 要 换 成 自己 系统 的 主 目录 路 径 ): 


au BufEnter/home/vincent/* setlocal tags+ = /home/vincent/Linux- 2.6.31/tags 


另外 ,还 需要 一 个 很 重要 的 vim 命令 ts, 因 为 要 跳 转 的 关键 词 可 能 出 现在 库 函 数 中 ,也 
可 能 出 现在 内 核 源 码 中 ,还 可 能 同时 都 有 对 此 关键 字 的 定义 ,这 时 需要 在 vim 命令 模式 下 和 输 
入 :ts 来 罗列 所 有 出 现 该 声明 关键 字 的 地 方 (注意 ,需要 先 把 光标 停 在 想 要 跳 转 的 关键 字 
上 ) ,然后 按 相应 的 序号 再 进行 跳 转 。 罗 列 的 次 序 与 在 vimrc 中 写 au 指令 的 顺序 相关 。 

4. Taglist 

Taglist 是 vim 的 一 个 插件 ,可 以 方便 地 在 终端 侧 边 显示 出 当前 程序 所 有 的 函数 、 宏 
等 信息 ,支持 鼠标 双击 跳 转 ,对 于 规模 比较 大 的 代码 而 言 ,这 是 一 个 非常 实用 的 功能 。 
Taglist 使 用 非常 简单 ,在 网 上 下 载 一 个 配置 文件 ,可 以 在 链接 http://download. csdn. 
net/detail/vincent040/6529593 中 下 载 。 

下 载 后 解压 ,会 出 现 doc 和 plugin 文件 夹 ,把 这 两 个 文件 夹 复制 到 主 目录 下 的 隐藏 
文件 夹 . vim 中 (如 果 没 有 ,可 创建 一 个 )。 完 成 后 ,用 vim 打开 程序 源码 ,输入 命令 
“Tlist”, 就 可 以 打开 列表 了 。 

5. vim 的 保存 文件 ,恢复 文件 与 打开 时 的 警告 信息 

目前 主要 的 编辑 软件 都 会 有 “恢复 ”功能 , 即 当 你 的 系统 因为 某 些 原因 而 导致 类 似 死 
机 的 情况 时 ,还 可 以 通过 某 些 特别 的 机 制 来 让 你 将 之 前 未 保存 的 数据 “ 救 " 回 来 。 这 就 是 
所 谓 的 “恢复 ”功能 ,vim 也 有 此 功能 ,是 通过 “保存 文件 ”来 挽回 数据 的 。 

当 在 使 用 vim 编辑 时 ,vim 会 在 被 编辑 的 文件 目录 下 再 创建 一 个 名 为 . filename. swp 
的 文件 。 例 如 曾 创建 过 的 hello. c 文件 ,编辑 hello. c 时 ,vim 会 主动 创建 /tmp/vitest/. 
hello. c. swp 的 暂 存 文件 ,对 hello. c 的 操作 就 会 被 记录 到 . hello. c. swp 当中 。 如 果 系 统 
因为 某 些 原因 中 断 ,导致 编辑 的 文件 还 没有 保存 ,这 个 时 候 . hello. c. swp 就 能 发 挥 救援 
功能 。 
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以 下 举例 说 明 . hello. c. swp 文件 的 作用 。 

当 在 vim 的 一 般 模 式 下 按 下 Ctrl 十 z 组 合 键 时 ,vim 将 会 被 放 到 后 台 去 执行 。 

通过 命令 ls -al 可 以 查看 到 ,出 现 了 . hello. c. swp 文件 。 

root@ubuntu:~#1s -al 

-rw-r--r--  lroot root 7^4 1 月 1112:17 hello.c 

-rw-r--r--  lrootroot 4096 1 月 1112:17 .hello.c.swp 

接 下 来 模拟 将 vim 的 工作 不 正常 地 中 断 ,在 Shell 下 输入 如 下 命令 ,模拟 中 断 vim 
工作 。 


root&ubuntu:^ # kill - 9 $1 


当 用 户 再 次 输入 vim hello. c 时 ,会 出 现 如 图 2. 8 所 示 的 界面 ,从 界面 中 的 第 二 行 可 
以 看 出 ,Linux 发 现 了 . hello. c. swp 文件 ,因为 该 文件 的 存在 ,所 以 可 以 执行 多 种 文件 修 
复 操作 。 


325: ik 


意 

| 发现 交换 文件 ".hello.c.swp" 

所 有 者 : root 。 日 期 : Mon Jan 15 07:42:37 2018 

文件 名 : -root/hello.c 

修改 过 : 否 

用 户 名 : root 主机 名 : ubuntu 

进程 TD: 36764 ( 仍 在 运行 ) 
正在 打开 文件 E Hm 


: Thu Jan 11 12:17:05 2018 


(1) Another program may be editing the same file. If this is the case, 
be careful not to end up with two different instances of the same 
file when making changes. Quit, or continue with caution. 

(2) An edit session for this file crashed. 

如 果 是 这 样 ， 请 用 "irecover" SK "vim -r hello.c" 
恢复 修改 的 内 容 (请 见 ":help recovery"). 

如 果 你 已 经 进行 了 恢复 ， 请 删除 交换 文件 ".hello.c.swp" 
以 避免 再 看 到 此 消息 。 


换文 件 ".nello.c.swp" 
DEEA A D). WAR), RH (i), rPiE(O)):- 


图 2.8 vim 异常 退出 ,再 次 进入 时 的 警告 信息 界面 


图 2. 8 中 最 后 一 行 是 系统 可 提供 的 多 种 文件 修复 方式 ,具体 解释 如 下 : 

* [O]pen Read-Only: 打 开 此 文件 成 为 只 读 文件 ,可 以 用 在 你 只 是 想 要 查阅 该 文件 
内 容 并 不 想 要 进行 编辑 行为 时 。 一 般 来 说 ,在 上 课时 ,如 果 你 是 登录 到 同学 的 计 
算 机 去 看 他 的 配置 文件 ,结果 发 现 其 实 同学 他 自己 也 在 编辑 时 ,可 以 使 用 这 个 
模式 。 

(CE)dit anyway: 还 是 用 正常 的 方式 打开 你 要 编辑 的 那个 文件 ,并 不 会 载 人 和 暂 存 文 
件 的 内 容 。 不 过 很 容易 出 现 两 个 用 户 互相 改变 对 方 的 文件 内 容 。 

(CR)ecover: 就 是 加 载 暂 存 文件 的 内 容 , 用 在 你 要 救 回 之 前 未 保存 的 工作 。 不 过 当 
你 救 回来 并 且 保 存 离开 vim 后 ,还 是 要 手动 自行 删除 那个 暂 存 文件 ,否则 每 次 使 
用 vim 打开 文件 时 都 会 出 现 图 2. 8 的 界面 。 

Quit: 按 下 q 就 离开 vim ,不 会 进行 任何 操作 回 到 命令 提示 符 。 

(Abort: 中 止 这 个 编辑 行为 ,返回 到 命令 提示 符 。 
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注意 : 如 果 不 想 在 vim hello. c 命令 后 ,出 现 如 图 2. 8 所 示 的 界面 ,需要 用 户 自 行 删 
除 掉 . hello. c. swp 文件 。 

6. vim 环境 设置 与 记录 : ~/. vimre, ~/viminfo 

如 果 在 vim 环境 中 查找 一 个 文件 内 部 某 个 字符 串 时 ,这 个 字符 串 会 被 反 白 ,而 下 次 
再 以 vim 编辑 这 个 文件 时 ,该 字符 串 的 反 白 情况 仍然 存在 ,甚至 在 编辑 其 他 文件 时 ,如 果 
其 他 文件 内 也 存在 这 个 字符 串 ,也 会 主动 反 白 。 另 外 , 当 重 复 编辑 同一 文件 时 ,第 二 次 进 
入 该 文件 时 ,光标 会 出 现在 上 次 离开 的 位 置 。 

这 是 因为 vim 会 主动 将 曾经 做 过 的 行为 记录 下 来 ,下 次 可 以 轻松 作用 。 这 个 记录 操 
作 的 文件 是 一 /. viminfo。 如 果 曾 经 使 用 过 vim, 那 主 文件 夹 应 该 会 存在 这 个 文件 ,该 文件 
是 自动 产生 的 ,用 户 在 vim 中 所 做 过 的 操作 ,在 这 个 文件 内 都 可 查询 到 。 

此 外 ,每 个 Linux 发 行 版 本 对 vim 的 默认 环境 不 太 相 同 。 比 如 , 某 些 版 本 查找 关键 字 
时 不 会 高 亮 反 白 , 有 些 版 本 则 会 主动 进行 缩 排 行为 ( 即 按 下 Enter 键 编辑 新 的 一 行 时 , 光 
标 不 会 在 行 首 ,而 是 在 与 上 一 行 的 第 一 个 非 空 格 符 处 对 齐 )。 这 些 其 实 都 可 以 自行 设置 ， 
即 进行 vim 的 环境 设置 。vim 的 环境 设置 参数 有 很 多 ,如 果 想 知道 目前 的 设置 值 ,可 以 在 
一 般 模式 时 输入 “: set all" 来 查阅 。 设 置 选项 很 多 , 表 2. 4 列 出 一 些 常 用 的 设置 值 , 供 
参考 。 

表 2.4 vim 环境 设置 常用 参数 
$ Wu *$ X 


ER 设置 和 取消 行 号 


:Set nOnu 


epi 是 否 自动 缩 排 ,autoindent 是 自动 缩 拓 


:Set noautoindent 


是 否 自动 保存 备份 文件 RETE nobackup, 如 果 设 置 backup, 那 么 当 用 户 改 


sset Gacki 动 任何 一 个 文件 时 ,原文 件 就 会 被 另存 为 一 个 文件 名 为 filename~ 的 文件 
:set ruler 显示 或 不 显示 右 下 角 的 一 些 状态 栏 说 明 
:set showmode 是 否 要 显示 --INSERT-- 之 类 的 字眼 在 左下 角 的 状态 栏 


一 般 来 说 ,如 果 按 下 i 进入 编辑 模式 后 ,可 以 利用 退 格 键 (backspace) 来 删除 
任意 字符 ,但 是 , 某 些 发 行 版 本 不 允许 如 此 。 此 时 ,可 以 通过 backspace 来 设 
置 。 当 backspace 为 2 时 ,可 以 删除 任意 值 ; 为 0 或 1 时 , 仅 可 删除 刚才 输入 
的 字符 ,而 无 法 删除 原本 就 已 经 存在 的 字符 

:set all 显示 目前 所 有 的 环境 参数 设置 值 


显示 与 系统 默认 值 不 同 的 设置 参数 ,一 般 来 说 是 用 户 自行 变动 过 的 设置 


:set backspace= (012) 


:Set 


表示 是 否 依据 程序 相关 语法 显示 不 同 颜色 ,如 果 编 写 程序 “:syntax on ”会 
主动 帮 用 户 除 错 , 但 是 ,如 果 仅 是 编写 纯 文 本 文件 ,要 避免 颜色 对 屏幕 产生 
的 干扰 , 则 可 以 取消 这 个 设置 


:set bg 一 dark 可 用 以 显示 不 同 的 颜色 色调 ,默认 是 light。 如 果 经 常 发 现 批注 的 字体 深蓝 
:set bg 一 light 色 看 着 不 舒服 ,这 里 可 以 设置 为 dark, 会 有 不 同 的 样式 


:Syntax on 
:syntax off 
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如 果 每 次 在 vim 的 命令 模式 下 设置 需要 的 环境 ,而 当下 次 进入 vim 时 还 是 需要 重 
新 设置 环境 ,因此 建议 在 配置 文件 中 直接 配置 个 人 习惯 的 vim 操作 环境 。 整体 vim 的 
设置 值 一 般 是 放置 在 /etc/vimre 这 个 文件 中 。 不 过 ,不 建议 用 户 修改 它 。 用 户 可 以 修 
改 ~/. vimrc 文 件 (默认 不 存在 ,需要 创建 ) ,将 环境 设置 值 写 人 此 文件 ,如 图 2.9 所 示 。 


二 这 个 文件 的 双 引号 (") 是 批注 
:set hlsearch "高 


á 
:ser backspace-2 "可 随时 用 退 格 键 删 除 
"自动 缩 排 


iset ruler "可 显示 最 后 一 行 的 状态 
:sec showmode "左下 角 那 一 行 的 状态 _ 
set nu "在 每 一 行 的 最 前 面 显 示 行 号 
set bg-dark "显示 不 同 的 底 色色 调 _ 
isyntax on "进行 语法 检验 ， 颜 色 显示 


图 2.9 vim 环境 配置 


这 样 每 次 启动 vim 都 可 以 应 用 用 户 自己 所 定义 的 环境 。 


2.2 gcc 编译 器 


Linux 下 最 常用 的 C 编译 器 是 gcc (GNU Complier Collection, http://gcc. gnu. 
org), gcc 是 一 个 ANSI C 兼容 的 编译 器 。 编 译 器 可 以 把 使 用 高 级 语言 编写 的 源 代 码 构 
建成 计算 机 能 够 直接 执行 的 二 进 制 代码 。gcc 不 仅 功能 非常 强大 ,结构 也 非常 灵活 。 此 
外 , 它 还 可 以 编译 由 C++ „Java, Fortran, Pascal 和 Ada 等 语言 编写 的 程序 。 

gcc 是 Linux 平台 常用 编译 器 之 一 。 同 时 ,在 Linux 平台 下 的 嵌入 式 开 发 领域 ,gcc 
也 是 使 用 最 多 的 一 种 编译 器 。gcc 之 所 以 被 广泛 使 用 ,除了 功能 强大 、 简 单 灵 活 的 特点 
外 ,还 因为 它 能 支持 各 种 不 同 的 硬件 平台 。 同 时 ,gcc 还 能 运行 在 不 同 的 操作 系统 上 ,如 
Linux, Solaris, Windows 等 。 它 既 支 持 基于 宿主 的 开发 (为 某 平 台 编 写 的 程序 ,就 在 该 平 
台 上 编译 ) ,也 支持 交叉 编译 (在 A 平台 上 编译 的 程序 供 B 平 台 使 用 )。 

C++ 编译 器 (如 g++ , 即 GUN compiler for C++ ) 也 可 以 用 于 编译 C 程序 ,但 事实 上 
g++ 内 部 还 是 调用 了 gcc, 只 不 过 加 上 了 一 些 命令 行 参 数 使 得 它 能 够 识别 C++ 源 代 码 。 
在 此 主要 介绍 gcc 编译 器 。 

gcc 命令 可 以 启动 C 编译 系统 。 当 执行 gee 命令 时 , 它 将 完成 预 处 理 、 编 译 、 汇 编 和 
链接 4 个 步骤 并 最 终生 成 可 执行 代码 。 产 生 的 可 执行 程序 默认 被 保存 为 a. out 文件 。 
gcc 命令 可 以 接受 多 种 文件 类 型 并 依据 用 户 指定 的 命令 行 参 数 对 它 做 出 相应 处 理 。 这 些 
文件 类 型 包括 静态 链接 库 ( 扩 展 名 为 . a) LC 语言 源 文件 (. c)、C++ 源 文件 (. C、. cc 或 者 
. cpp) ,汇编 语言 文件 (. s) \ 预 处 理 输出 文件 (.D 和 目标 代码 (.o) 。 如 果 gcc 无 法 根据 一 个 
文件 的 扩展 名 决定 它 的 类 型 , 它 将 假设 这 个 文件 是 一 个 目标 文件 或 库 文件 。gcc 支持 编 
译 的 扩展 名 及 对 应 的 语言 关系 见 表 2. 5 所 示 。 

gcc 命令 使 用 格式 如 下 : 


root&ubuntu:- # goc [options] filename- list 
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表 2.5 gcc 支持 编译 的 扩展 名 


扩展 名 对 应 的 语言 扩展 名 对 应 的 语言 

2 C 原始 程序 .di 已 经 过 预 处 理 的 C++ 原始 程序 
JU C++ 原始 程序 E 汇编 语言 原始 程序 

.ce C++ 原始 程序 i 汇编 语言 原始 程序 

.CXX C++ 原始 程序 sd 预 处 理 文件 ( 头 文件 ) 

.m Objective-C 原始 程序 .0 目标 文件 

E 已 经 过 预 处 理 的 C 原始 程序 .a/. so 编译 后 的 库 文件 


options 的 选项 有 100 多 个 ,很 多 选项 一 般 用 不 到 ,常用 选项 如 下 : 

。 -ansi : 依据 ANSI 标准。 

-c: 只 编译 , 跳 过 链接 步骤 ,编译 成 目标 (.o) 文 件 。 通 常用 于 不 包含 主 程序 的 子 程 
序 文 件 。 

-g: 创建 用 于 gdbC GNU DeBugger) 的 符号 表 和 调试 信息 。 要 对 源码 进行 调试 ,就 
必须 在 编译 程序 时 加 入 这 个 选项 。 

-1 库 文件 名 : 链接 库 文件 。 

-m 类 型 : 根据 给 定 的 CPU 类 型 优化 代码 。 

-0 文件 名 : 将 生成 的 可 执行 程序 保存 到 指定 文件 中 ,而 不 是 默认 的 a. out。 

-O[ 级 别 ]: 对 程序 进行 优化 编译 、 链 接 ,根据 指定 的 级 别 (0 一 3) 进 行 优化 ;数字 越 
大 优化 程度 越 高 。 如 果 指 定 级 别 为 OGRU) ,编译 器 将 不 做 任何 优化 。 优 化 后 的 
可 执行 程序 执行 效率 高 ,但 编译 和 链接 的 速度 会 相对 慢 一 些 。 

-pg: 产生 共 GUN 剖析 工具 gprof 使 用 的 信息 。 

-S: 跳 过 汇编 和 链接 阶段 ,并 保留 编译 产生 的 汇编 代码 (. s 文件 )。 

-E: 生成 经 过 预 处 理 的 源 程序 文件 (.i 文件 )。 

-v: 产生 尽 可 能 多 的 输出 信息 。 

-w: 忽略 警告 信息 。 

-W: 产生 比 默认 模式 更 多 的 警告 信息 。 

-Idirname: 将 名 为 dirname 的 目录 加 入 到 程序 头 文件 目录 列表 中 , 它 是 在 预 处 理 
阶段 使 用 的 选项 ,I 意 为 include。 

-Ldirname: 将 名 为 dirname 的 目录 加 入 到 程序 的 库 文件 搜索 目录 列表 中 , 它 是 在 
链接 过 程 中 使 用 的 参数 。L 意 为 Link。 在 默认 情况 下 , gcc 在 默认 路 径 中 (如 
/usr/lib) 寻 找 所 需要 的 库 文件 ,这 个 选项 告诉 编译 器 ,首先 到 -L 指定 的 目录 中 去 
寻找 ,然后 到 系统 默认 的 路 径 中 寻找 ,如 果 函 数 库存 放 在 多 个 目录 下 ,就 需要 一 次 
使 用 这 个 选项 ,给 出 相应 的 存放 目录 。 

-lname: 指示 编译 器 ,在 链接 时 .装载 名 为 libname. a 的 函数 库 , 该 函数 库 位 于 系 
统 预定 义 的 目录 或 -L 选项 指定 的 目录 下 。 例 如 ,-lm 表示 链接 名 为 libm. a 的 数 
学 函数 库 。 
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在 C 语 言 程序 中 , 头 文件 被 大 量 使 用 。 一 般 而 言 ,C 程序 通常 有 头 文件 (header files) 
和 定义 文件 (definition files) ,而 定义 文件 用 于 保存 程序 的 实现 。C 程序 的 头 文件 以 “. h” 
An. 

接 下 来 介绍 一 个 源 程序 的 编译 过 程 。 

gcc 编译 程序 时 ,编译 过 程 可 以 分 为 4 个 阶段 ,分 别 是 预 处 理 、 编 译 . 汇 编 和 链接 。 
Linux 程序 员 可 以 根据 自己 的 需要 让 gee 在 编译 的 任何 阶段 结束 ,以 便 检查 或 使 用 编译 
器 在 该 阶段 的 输出 信息 ,或 者 对 最 后 生成 的 二 进 制 文件 进行 控制 ,以 便 通 过 加 入 不 同 数量 
和 种 类 的 调试 代码 来 为 今后 的 调试 做 好 准备 。 与 其 他 常用 的 编译 器 一 样 , gcc 也 提供 了 
灵活 而 强大 的 代码 优化 功能 ,利用 它 可 以 生成 执行 效率 较 高 的 代码 。 

(1) 预 处 理 (Preprocessing) 也 称 为 预 编译 ,主要 功能 是 对 各 种 预 处 理 命令 进行 处 理 ， 
如 头 文件 的 包含 (include) 、 宏 定义 的 扩展 (define) 以 及 条 件 编译 (ifdef…endif) 等 。 该 阶 
段 会 生成 一 个 中 间 文 件 “.i”, 但 实际 工作 中 一 般 不 用 专门 生成 这 个 这 种 文件 ,车 必须 要 生 
成 这 种 文件 ,可 用 gec 的 参数 -E 指定 gec 只 在 预 处 理 结束 后 才 停 止 编 译 过 程 ,例如 下 面 的 
代码 所 示 : 

root@ubuntu:~ # gcc hello.c -o hello.i -E 

(2) 编译 CCompilation & Assembly) : 在 编译 阶段 ,输入 的 是 中 间 文 件 “.i”,gcc 首先 
要 检查 代码 的 规范 性 .是 否 有 语法 错误 等 ,以 确定 代码 实际 要 做 的 工作 。 在 检查 无 误 后 ， 
gcc 把 代码 翻译 成 汇编 语言 ,生成 汇编 语言 文件 “. s”"。 用 gee 的 参数 -S 指定 gee 只 进行 编 
译 产生 汇编 代码 ,例如 下 面 的 代码 所 示 : 

root@ubuntu:~ # goc hello.i -o hello.s -S 

(3) 汇编 (Assembling) : 汇编 阶段 是 把 编译 阶段 生成 的 *.s* 文 件 转换 成 目标 文件 ,把 
汇编 代码 转化 为 ". o" 文 件 的 二 进 制 代码 。 用 gee 的 -c 指定 gec 只 在 汇编 结束 后 停止 链接 
过 程 。 例 如 下 面 的 代码 所 示 + 

root@ubuntu:~ # gcc hello.s -o hello.o - c 

(4) 链接 : 此 阶段 将 输入 的 二 进 制 文件 (. 文件 ) 与 其 他 机 器 代码 文件 和 库 文件 链接 
成 一 个 可 执行 的 二 进 制 文件 。 例 如 下 面 的 代码 所 示 : 

root@ubuntu:~ # gcc hello.o - o hello 

依次 执行 上 面 的 4 条 代码 ,最终 将 会 生成 可 执行 文件 hello。 也 可 以 将 这 个 过 程 简化 
为 一 条 命令 来 统一 实现 , 即 : 


root@ubuntu:~ # gcc hello.c -o hello 
2.3 gdb 调试 器 


在 Linux 应 用 程序 中 ,最 常用 的 调试 器 是 gdb. gdb 采用 GPL 授权 条 款 , 是 GUN 的 
计划 之 一 ,所 以 任何 人 都 可 以 免费 得 到 和 使 用 它 。 在 安装 Linux 操作 系统 时 ,如 果 选 择 安 
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装 gdb.gdb 就 会 被 自动 安装 。gdb 与 其 他 调试 器 一 样 ,可 以 在 程序 中 设置 断 点 、 查 看 变量 
值 一步 一 步 跟踪 程序 的 执行 过 程 ,程序 运行 时 会 在 断 点 处 暂时 停止 运行 ,进入 挂 起 状态 ， 
因此 程序 人 员 可 以 查看 程序 当前 暂停 时 的 状态 ,如 变量 、 栈 等 的 值 。 利 用 调试 器 的 这 些 功 
能 可 以 方便 地 找 出 程序 中 存在 的 非 语法 错误 。 
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gdb 调试 的 对 象 是 可 执行 文件 ,而 不 是 程序 的 源 代码 。 如 果 要 使 一 个 可 执行 文件 可 
以 被 gdb 调试 ,那么 在 使 用 编译 器 gcc 编译 程序 时 需要 加 入 -g 选项 。-g 选项 告诉 gcc 在 
编译 程序 时 加 入 调试 信息 。 这 样 gdb 才 可 以 调试 这 个 被 编译 的 程序 。 

gdb 调试 程序 的 命令 格式 为 : 


gb 程序 文件 名 
所 调试 的 程序 在 使 用 gcc 进行 编译 时 ,必须 要 添加 -g 选项 ,建立 gdb 的 调试 信息 。 以 
下 是 进行 gdb 调试 的 过 程 。 


首先 编写 一 个 用 于 调试 的 测试 程序 test. c。 该 程序 中 包含 一 个 名 为 get_sum IJ PR 
数 , 它 用 来 求 整数 1 到 n 的 和 ,代码 如 示例 程序 2. 1 所 示 。 


[示例 程序 2.1 test.c] 
# include< stdio.h> 


int get sum(int n) 

t 
int sme 0,i7 
for(i-0;i«n;it*) 
sumt-i; 
return sum 

) 


int main() 
{ 
int i= 100, result; 
result-get sum(i); 
printf ("1+ 2+ *** + $d- $d\n", i, result); 
retum 0; 
x 


编译 并 运行 该 程序 : 

root@uantu:~ # goc -g test.c - o test 

root8ubuntu:^ # ./test 

1+ 2+ +++ 100- 4950 

从 程序 的 运行 情况 可 以 看 到 ,输出 结果 为 4950 ,而 正确 的 输出 应 为 5050。 程 序 虽然 
没有 语法 错误 ,但 显然 存在 逻辑 错误 ,需要 使 用 gdb 查找 错误 。 在 Shell 环境 下 输入 gdb 
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test 之 后 ,将 会 显示 以 下 信息 : 


root@ubuntu:~ /z11/2/2.3.2# gb test. 

GNU gb (Ubuntu 7.7.1- Oubuntu5- 14.04.2) 7.7.1 

Copyright (C) 2014 Free Software Foundation, Inc. 

Iicense GPLIV3+ : GNU GEL version 3 or later « http://gmi.org/licenses/qpl .htmb- 
This is free software: you are free to change and redistribute it. 
There is NO WARRANTY, to the extent permitted by law. Type "show copying" 
and "show warranty" for details. 

This GIB was configured as "x86 64- linux- gnu". 

Type "show configuration" for configuration details. 

For bug reporting instructions, please see: 

< http://www.gnu.org/software/gdb/bugs/» . 

Find the GTB manual and other documentation resources online at: 

€ http://ww.gnu.org/software/gdb/docurentation/» . 

For help, type "help". 

Type "apropos word" to search for commands related to "word"... 

Reading symbols fram test..done. 

(ado) 


启动 gdb 后 ,首先 显示 了 一 段 版 权 说 明 , 然 后 是 gdb 的 提示 符 : (gdb)。 可 以 在 (gdb) 
之 后 输入 调试 命令 。 

注意 : 如 果 要 使 gdb 启动 时 不 输出 版 权 说 明 , 可 以 在 执行 时 加 上 -q 选项 ,如 : gdb -q 
test。 也 可 以 在 Linux 提示 符 下 ,直接 输入 gdb, 然 后 使 用 file 命令 装 入 要 调试 的 程序 。 
例如 : 

root8ubuntu:^ # gb -q test. 

Reading symbols frm test..done. 

(gb) 

需要 结束 调试 时 ,可 以 使 用 quit 命令 返回 到 Linux 提示 符 状态 下 。 


(gd) quit 
rootQ$ubuntu:^ # 


232 显示 和 查找 程序 源 代 码 


在 调试 程序 时 ,一 般 要 查看 程序 的 源 代码 。list 命令 用 于 列 出 程序 的 源 代 码 , 它 的 使 
用 格式 如 下 所 示 : 

* list; 显示 10 行 代 码 , 若 再 次 运行 该 命令 则 显示 接 下 来 的 10 行 代码 。 
list 5,10: 显示 第 5 一 10 行 的 代码 。 
list test. c:5,10: 显示 源 文件 test. c 中 的 第 5 一 10 行 的 代码 ,在 调试 含有 多 个 源 
文件 的 程序 时 使 用 。 
list get sum: 显示 get sum 函数 周围 的 代码 。 
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e list test. c; get sum; 显示 源 文 件 test. c 中 get sum 函数 周围 的 代码 ,在 调试 含 
有 多 个 源 文件 的 程序 时 使 用 。 
下 面 是 关于 “list 5,10” 和 “list get_sum” 命 令 的 运行 展示 。 


(gdb) list 5,10 
int sum-0,i; 
for(i- Ori nit * ) 
t 
sm =i; 
return sum; 
} 
(gd) list get. sum 
# include< stdio.h» 


int get sum(int n) 

t 
int sum 0,i; 
for(i-0;i« n;it*) 
sumt-i; 
return sum; 

} 

注意 : 如 果 在 调试 过 程 中 要 运行 Linux 命令 ,可 以 在 gdb 提示 符 后 以 如 下 格式 输入 
Shell 命令 。 


(gh) shell 1s 


* search 和 forward 这 两 个 命令 都 是 用 来 从 当前 行 向 后 查找 第 一 个 匹配 的 字符 串 ， 
格式 如 下 : 


search 字符 串 
forward 字符 串 


reverse-search 命令 用 来 从 当前 行 向 前 查找 第 一 个 匹配 的 字符 串 ,格式 如 下 : 
reverse search F ff Hi 


下 面 分 别 是 search 和 reverse-search 命令 的 使 用 示例 和 运行 结果 展示 。 


(gb) search get. sum 
result-get sum(i); 
(gb) reverse- search main 


int mein() 
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使 用 gdb -q test 或 file test 只 是 装 人 程序 ,程序 并 没有 运行 。 如 果 要 使 程序 开始 运 
行 ,在 gdb 提示 符 下 输入 run 命令 即 可 。 
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(gb) run 

Starting program: /root/z11/2/2.3.2/test 

1+ 2+ +++ + 100= 4950 

[Inferior 1 (process 58203) exited normally] 

(ado) 

注意 : 如 果 想 要 详细 了 解 gdb 某 个 命令 的 使 用 方法 ,可 以 使 用 help 命令 。 
例如 : 


(gh) help list 
(gd) help al1 


前 一 个 命令 列 出 list 命令 的 帮助 信息 ,后 一 个 命令 列 出 所 有 gdb 命令 的 帮助 信息 。 
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在 调试 程序 时 ,往往 需要 程序 在 运行 到 某 行 、 某 个 函数 或 某 个 条 件 发 生 时 暂停 下 来 ， 
然后 查看 此 时 程序 的 状态 ,如 各 个 变量 的 值 . 某 个 表达 式 的 值 等 。 为 此 ,可 以 设置 断 点 。 
断 点 使 程序 运行 到 某 个 位 置 时 暂停 下 来 ,以 便 检查 和 分 析 程 序 , 断 点 是 程序 下 一 步 将 要 执 
行 的 语句 。 断 点 在 调试 程序 时 非常 有 用 ,因此 学 习 设置 和 管理 断 点 是 非常 必要 的 。 

1. 以 行 号 设置 断 点 

在 gdb 环境 中 调试 程序 时 ,可 以 使 用 break 命令 为 程序 设置 断 点 。 最 常用 的 方式 是 
为 某 行 设置 断 点 。 例 如 : 


(gdb) break 5 

Breakpoint 1 at 0x400534: file test.c, line 5. 
其 中 第 一 行 代码 表示 将 断 点 设置 在 程序 的 第 5 行 ,第 二 行 显示 了 gdb 在 设置 断 点 后 的 反 
馈 信 息 : test,c 文 件 的 第 5 行 设置 了 该 程序 的 第 一 个 断 点 ,位 于 该 程序 代码 中 逻辑 地 址 为 
0x400534 的 位 置 。 随 后 运行 run 命令 执行 test 程序 : 


(gdo) run 
Starting program: /root/z11/2/2.3.2/test 


Breakpoint l, get sum (n- 100) at test.c:5 

5 int sum-0,i; 

(gd) 

可 以 看 到 ,程序 在 执行 了 第 4 行 的 指令 后 就 暂停 了 ,第 5 行 的 代码 并 没有 执行 ,而 是 
被 gdb 的 断 点 中 断 了 。 此 时 ,可 以 使 用 print 命令 来 查看 各 个 变量 和 表达 式 的 值 , 以 了 解 
程序 当前 的 状况 。 也 可 以 根据 实际 情况 ,让 程序 一 步 一 步 地 执行 或 直接 运行 到 程序 结束 。 

2. 以 函数 名 设置 断 点 

在 break 命令 后 列 出 函数 名 , 即 可 将 断 点 设置 在 函数 开始 处 。 例 如 : 


(gdo) break get. sum 
Breakpoint 1 at 0x400534: file test.c, line 5. 
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(gb) run 
Starting program: /root/z11/2/2.3.2/test 


Breakpoint 1, get sum (n- 100) at test.c:5 


5 int sum-0,i; 


3. 以 条 件 表 达 式 设 置 断 点 
break 还 可 以 用 来 设置 这 样 的 断 点 : 在 程序 运行 过 程 中 , 当 某 个 条 件 满足 时 ,程序 在 
指定 的 位 置 暂 停 执行 ,命令 格式 为 : 


break 行 号 或 函数 名 if ARM 


下 面 是 对 “break 行 号 或 函数 名 i£ 条 件 " 命 令 的 示例 展示 。 为 了 方便 读者 理解 ,对 源 
代码 进行 了 编号 。 


(gb) list 1,17 


1 # include< stdio.h> 

2 

3 int get sum(int n) 

4 { 

5 int sum-0,i; 

6 for(i- 0;i« niit * ) 
了 sumt-i; 

8 return sum; 

9 ) 

10 

HW int main() 

12 t 

33 int i= 100,result; 
14 result-get sum(i); 
15 printf ("1+ 2* *** + $d- d\n", i, result); 
16 retum 0; 

17 i 


(gdb) break 7 if i==99 

Breakpoint 1 at 0x400544: file test.c, line 7. 
(gdo) run 

Starting program: /root/z11/2/2.3.2/test. 


Breakpoint 1, get sum (r= 100) at test.c:7 
7 sunt-i; 


从 代码 中 可 以 看 到 , 当 1—99 时 ,程序 将 会 在 第 7 行 代码 的 位 置 中 断 。 
除 此 之 外 ,还 可 以 使 用 watch 命令 暂停 程序 的 执行 过 程 : 


watch 条 件 表 达 式 
使 用 watch 命令 时 ,在 程序 运行 过 程 中 , 当 条 件 表达 式 的 值 发 生 改变 时 程序 就 会 暂停 
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。 以 下 是 一 个 使 用 watch 命令 结合 break 命令 调试 程序 的 示例 。 


root@ubntu:~ # gb -q test 

(gdb) watch i==99 

No syrbol "i" in current context. 

(gdb) break 6 

Breakpoint 1 at 0x40053b: file test.c, line 6. 
(gb) run 

Starting program: /root/z11/2/2.3.2/test. 


Breakpoint l, get sum (n- 100) at test.c:6 
6 for(i-0;i« niit*) 

(gd) watch i==99 

Hardware watchpoint 2: i- — 99 

(gd) clear 6 

已 删除 的 断 点 1 

(gdo) continue 

Hardware watchpoint 2: i== 99 


Old value - 0 

New value =1 

(0x000000000040054e in get sum (n- 100) at test.c:6 
6 for (i2 0;i« niit * ) 

(gb) print i 

$1-99 


(gd) print sum 

$2 = 4851 

(gd) 

gdb 运行 后 ,以 命令 watch i— —99 设置 条 件 断 点 ,因为 此 时 test 程序 尚未 运行 ,还 没 
有 关于 变量 i 的 定义 ,所 以 gdb 提示 在 当前 程序 上 下 文中 没有 符号 i。 为 了 解决 这 个 问 
题 ,必须 先 运行 程序 ,变量 i 才 有 定义 。 所 以 ,首先 在 第 6 行 设置 断 点 ,然后 使 用 run 命令 
运行 程序 ,程序 暂停 在 第 6 行 ,此 时 有 了 关于 变量 i 的 定义 。 这 时 就 可 以 使 用 watch i= — 
99 设置 断 点 了 。 而 第 6 行 断 点 已 经 没有 作用 了 ,可 以 使 用 clear 6 命令 删除 该 断 点 。 

continue 命令 将 会 使 程序 继续 运行 ,直到 执行 完 i 十 十 这 条 语句 ,i 值 变 为 99 时 ,使 之 
前 watch 命令 的 条 件 一 一 表达 式 i— — 99 的 值 为 1( 即 执行 i 十 十 前 旧 值 等 于 0, 执行 
i 十 十 后 新 值 等 于 1) ,说 明 watch 命令 的 条 件 成 立 ,程序 在 这 里 中 断 。 随 后 使 用 print i 和 
print sum 命令 显示 此 时 变量 i 和 sum 的 值 。 

继续 调试 test 程序 。 


(gdo) next. 
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(gdb) print i 

$1-99 

(gb) print sum 

$2 =4851 

(gb) next. 

6 for(i-0;i« niit) 
(gdb) print i 

$3-99 

(gb) print sum 

$4 = 4950 

(gd) next. 

Hardware watchpoint 2: i== 99 


Old value -1 

New value - 0 

(0x000000000040054e in get sum (n- 100) at test.c:6 
6 for(i-0;icn;it*) 

(gb) print i 

$5 =100 

(qb) print sum 

$6 = 4950 

(gdb) next. 

8 return sum; 


(gb) print i 

$7=100 

(gd) print sum 

$8 — 4950 

(gb) 

next 命令 用 于 继续 执行 下 一 条 语句 。 本 次 的 next 命令 将 会 判断 循环 控制 条 件 <n 
是 否 成 立 ,此 时 i 为 99,n 为 100, 循 环 条 件 成 立 , 因 此 gdb 环境 中 显示 “7 sum 十 二 i;”, 表 
明 下 一 条 要 执行 的 语句 为 sum 十 二 1。 之 后 再 输入 next, 此 时 sum 十 二 i 执行 完 ,下 一 条 要 
执行 的 语句 是 第 6 行 的 i 十 十 。 显 示 i 和 sum 的 值 ,可 以 看 到 分 别 为 99 和 4950。 

继续 输入 next 命令 ,显示 此 时 i 和 sum 的 值 ,分 别 为 100 和 4950。 第 四 次 输入 next 
命令 ,此 时 程序 刚刚 执行 完 判断 语 句 i 二 n, 原 本 应 该 执行 sum 十 二 i 语句 ,但 gdb 却 提示 程 
序 下 一 条 要 执行 的 语句 是 第 8 行 的 return sum, 这 意味 着 i 二 100 时 ,i 二 n 不 成 立 , 退 出 了 
for 循环 ,100 并 未 计 入 sum 求 和 。 

因此 可 以 确定 循环 控制 条 件 i<n 是 有 问题 的 .需要 将 i<n 改 为 <=<=n。 

对 于 简单 的 程序 ,如 果 仔 细 检 查 源 程序 ,就 可 以 发 现 程序 的 逻辑 错误 ,但 对 于 复杂 的 
程序 ,就 必须 使 用 像 gdb 这 样 的 调试 器 工具 ,一 步 一 步 地 跟踪 程序 的 运行 而 发 现 程 序 的 
逻辑 错误 。 

还 有 一 个 与 watch 类 似 的 命令 : awatch。 它 也 可 用 来 给 表达 式 设置 断 点 ,在 表达 式 
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的 值 发 生 改 变 或 表达 式 的 值 被 读 取 的 时 候 , 程 序 暂 停 执行 。 
4. 查看 当前 设置 的 中 断 点 
使 用 info breakpoints 命令 可 以 查看 当前 所 有 的 中 断 点 。 例 如 : 


(gdo) break 5 

Breakpoint 1 at 0400534: file test.c, line 5. 
(gb) break 15 if result== 5050 
Breakpoint 2 at 0400577: file test.c, line 15. 


Nun Type Disp Emb Address What 
1  breakpoint keep y  0x0000000000400534 in get sumat test.c:5 
2  breakpoint keep y 0x0000000000400577 in main at test.c:15 


Num 列表 示 断 点 的 编号 ;Type 列 指明 列表 中 项 目的 类 型 ,本 次 罗列 出 来 的 项 目 类 型 
为 breakpoint, 即 断 点 类 型 ;Disp 列 指示 中 断 点 在 生效 一 次 后 是 否 就 失去 作用 ,如 果 是 则 
为 dis, 不 是 则 为 keep; Enb 列表 明 当 前 中 断 点 是 否 有 效 ,y 表示 有 效 ,n 表示 无 效 ; 
Address 列表 示 中 断 点 在 程序 中 的 逻辑 地 址 ;What 列 指明 中 断 发 生 在 哪个 函数 的 第 几 
fT "stop only if result 王 一 5050” 表 明 这 是 一 个 条 件 中 断 。 

5. 中 断 失效 或 有 效 

使 用 disable 命令 可 以 使 某 个 断 点 失效 ,失效 后 断 点 依然 存在 ,但 不 起 作用 ,程序 运行 
到 该 断 点 时 不 会 停 下 来 而 是 继续 运行 。 使 用 enable 命令 可 以 使 某 个 失效 的 断 点 重新 生 


A. n. 
(gdo) info breakpoints 
Nun Type Disp Eb Adress What 


1  breakpoint keep y  0x0000000000400530 in get sumat test.c:5 
2 breakpoint keep y  0x0000000000400577 in main at test.c:15 
stop only if result= = 5050 


(gb) disable 1 
(gdo) info breakpoints 
Nun Type Disp Eb Adress What 


1  breakpoint keep n  0x0000000000400530 in get sumat test.c:5 
2 breakpoint keep y  0x0000000000400577 in main at test.c:15 


(gb) enable 1 
(gb) info breakpoints 
Nm Type Disp Enb Adiress What 


1 breakpoint keep y  Qx0000000000400534 inget sumat test.c:5 
2 breakpoint keep y 0x0000000000400577 in main at test.c:15 


“disable 1” 命 令 之 后 ,通过 “info breakpoints” 发 现 第 一 个 中 断 Enb 为 n 表明 失效 ,之 
后 ,“enable 1” 命 令 后 ,通过 “info breakpoints” 发 现 第 一 个 中 断 Enb Jg y 表明 有 效 。 
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6. 删除 断 点 


disable 只 是 让 某 个 断 点 暂时 失效 , 断 点 依然 存在 于 程序 中 。 如 果 要 彻底 删除 某 个 断 
点 ,可 以 使 用 clear 或 delete 命令 。 命 令 格 式 如 下 所 示 。 


clear // 删 除 程序 中 所 有 的 断 点 

clear 行 号 /删除 此 行 的 断 点 

clear 函数 名 /删除 该 函数 的 断 点 

dlete 断 点 编号 ”// 删 除 指定 编号 的 断 点 ,如 果 一 次 要 删除 多 个 断 点 ,各 个 断 点 编号 以 空格 隔 开 
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当 程 序 执行 到 中 断 暂停 执行 时 ,往往 要 查看 变量 或 表达 式 的 值 , 借 此 了 解 程序 的 执行 
状态 ,进而 发 现 问题 所 在 。 接 下 来 介绍 的 print 命令 .whatis 命令 和 set 命令 可 以 帮助 了 
解 变量 的 状态 。 

1. print 命令 

print 命令 一 般 用 来 打印 变量 或 表达 式 的 值 ,也 可 以 打印 内 存 中 从 某 个 变量 开始 的 一 
段 内 存 区 域 的 内 容 ,还 可 以 用 来 对 某 个 变量 进行 赋值 。 其 使 用 格式 为 : 


print 变量 或 表达 式 ; // 打 印 变量 或 表达 式 当 前 的 值 

print 变量 = 值 ; // 对 变量 进行 赋值 

print 表达 式 8 要 打印 的 值 的 个 数 n. // 打 印 以 表达 式 值 开始 的 n 个 数 

以 下 代码 是 使 用 print 命令 查看 变量 和 表达 式 值 以 及 为 变量 赋值 的 一 个 示例 。 
(gdo) break 7 

(gd) run 


Starting program: /root/zll/2/2.3.2/test 


Breakpoint l, get sum (n- 100) at test.c:7 
7 sumt-i; 

(gb) print i«n 

$5721 

(gio) print i 

$60 

(gdb) print sum 

$0 

(gdb) print i= 300 

$8- 300 

(gio) print i 

$9- 300 

(gdo) continue 

lt 2+ +++ 100- 300 

[Inferior 1 (process 58863) exited normally] 
(ado) 
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以 上 代码 在 test. c 程序 的 第 7 行 设置 断 点 后 ,使 用 run 命令 开始 运行 程序 。 在 执行 
完 第 6 行 的 语句 后 ,程序 暂停 下 来 。 随 后 用 print 命令 显示 表达 式 in 的 值 为 1,i 和 sum 
值 均 为 0。 紧 接着 使 用 print i 一 300 命令 给 变量 i 赋值 为 300, 并 使 用 continue 语句 让 程 
序 继续 执行 。 程 序 在 输出 1 十 2 十 … 十 100 王 300 后 结束 。 

为 什么 1 十 2 十 … 十 100 王 300 而 不 是 等 于 4095 呢 ? 因为 在 调试 过 程 中 ,i 被 赋 为 
300, 导 致 语句 sumt =i 只 执行 了 一 次 ,sum 被 加 为 300, 随 后 循环 控制 条 件 in 不 成 立 ， 
因此 退出 for 循环 , 求 和 结束 ,返回 sum 的 值 为 300。 

2. whatis 命令 

whatis 命令 用 来 显示 某 个 变量 或 表达 式 值 的 数据 类 型 ,格式 如 下 : 

whatis 变量 或 表达 式 

(gb) whatis i 

type- int 

(gb) whatis it 1.5 

type- double 

(gb) 

可 以 看 到 ,程序 运行 后 ,变量 i 的 数据 类 型 是 int, 而 i 十 1.5 的 数据 类 型 是 double. 

3. set 命令 

set 命令 可 以 用 来 给 变量 赋值 ,使 用 格式 是 : 


set variable 变量 = 值 


将 上 面 示例 中 的 print 1300 改 为 set i=300 效果 相同 。 
除了 这 个 用 法 外 ,set 命令 还 有 一 些 其 他 用 法 ,比如 可 以 针对 远程 调试 进行 设置 ,可 以 
用 来 设置 gdb 一 行 的 字符 数 等 。 
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调试 过 程 中 ,根据 当前 程序 运行 的 情况 ,需要 使 程序 继续 运行 至 下 一 断 点 处 暂停 、 停 
止 调试 或 者 让 程序 以 单 步 执 行 的 方式 运行 ,以 下 几 个 命令 可 以 控制 程序 的 执行 方式 。 

1. continue 命令 

让 程序 继续 运行 ,直到 遇 到 下 一 个 断 点 或 程序 运行 完毕 。 该 命令 的 格式 为 ， 

continue 

2. kill 命令 

该 命令 用 于 结束 当前 程序 的 调试 ,在 gdb 提示 符 下 输入 kill, gdb 会 询问 是 否 退出 当 
前 程序 的 调试 ,输入 y 结束 调试 ,输入 n 继续 调试 程序 。 

3. next 和 step 命令 

next 和 step 命令 可 以 控制 程序 每 次 单 步 执行 一 句 源 语 言 代 码 , 即 单 步 运行 方式 。 
next 命令 的 使 用 方法 在 前 面 已 经 演示 过 了 ,step 命令 使 用 方式 与 next 命令 类 似 。 两 者 的 
区 别 是 : 如 果 遇 到 函数 调用 ,next 会 把 该 函数 调用 当 作 一 条 语句 来 执行 ,再 次 输入 next 
会 执行 函数 调用 后 的 语句 ;而 step 则 会 跟踪 进入 被 调 函 数 , 转 入 该 函数 按照 后 续 命令 指 
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定 的 方式 执行 ,直到 调用 结束 继续 执行 该 函数 调用 语句 之 后 的 代码 。 


以 下 是 使 用 step 命令 控制 程序 执行 方式 的 一 个 示例 。 
(gb) break 13 
Breakpoint 1 at 0400563: file test.c, line 13. 


(gb) run 
Starting program: /root/z11/2/2.3.2/test 


Breakpoint 1, main() at test.c:13 


13 int i- 100, result; 
(gb) step 

14 result-get sum(i); 
(gd) step 

get sum (n- 100) at test.c:5 

5 int sum-0,i; 

(gb) step 

6 for(i-0;i«n;it*) 
(gd) 


本 例 在 test. c 程序 的 第 13 行 设置 了 断 点 。 运 行 run 命令 后 执行 第 一 条 step 命令 , 程 
序 将 会 执行 第 13 行 的 代码 ,并 提示 下 一 个 要 执行 的 是 第 14 行 的 语句 result= get_sum(i) 。 
再 次 执行 step 命令 ,提示 即将 执行 第 5 行 的 “int sum 二 0, i”, 在 此 可 以 看 出 第 二 次 执行 


step 命令 时 ,程序 运行 发 生 了 跳 转 ,进入 了 get sum PR, 
4. nexti 和 stepi 命令 


nexti 和 stepi 命令 用 来 单 步 执行 一 条 机 器 指令 ,而 不 是 单 步 执行 一 句 源 语言 代码 。 


通常 一 句 源 语言 代码 是 由 多 条 机 器 指令 组 成 的 。 
例如 ,对 于 test. c 的 第 6 行 语句 : 


for(i=0;i<n;i++) 


如 果 是 单 步 执行 一 条 机 器 指令 , 则 这 行 语句 要 输入 多 个 nexti 和 stepi 才能 执行 完 ， 
i=0 和 i<n 会 分 开 执行 。 而 对 于 单 步 执行 一 句 源 语言 代码 来 说 ,只 需 输入 一 个 next 或 


step 就 可 以 执行 完 。 


nexti 与 next 类 似 , 不 会 跟踪 进入 被 调 函 数 内 部 去 执行 。 


跟踪 进入 被 调 函 数 内 部 执行 。 
以 下 是 使 用 stepi 调试 程序 的 一 个 示例 。 
(gdo) break 6 
Breakpoint 1 at 0400530: file test.c, line 6. 


(gdo) run 
Starting program: /root/z11/2/2.3.2/test 


Breakpoint 1, get sum (n- 100) at test.c:6 
6 for(i=0;i<n;i++) 


而 setpi 与 step 类 似 , 将 会 


(0:0000000000400542 6 for(i-0;i«n;it*) 
(0:000000000040054e 6 for(i- 0;i« nrit*) 
(0x0000000000400551. 6 for(i-0;i«n;it*) 


(03:0000000000400554 6 for(i-0;i«n;it*) 


(gd) 

在 使 用 run 命令 运行 程序 后 ,程序 在 执行 完 第 5 行 后 暂停 ,并 提示 下 一 条 要 执行 的 是 
第 6 行 语句 。 执 行 stepi 命令 后 ,gdb 开始 执行 第 6 行 的 语句 ,随后 提示 下 一 条 要 执行 的 
还 是 第 6 行 语句 。 连 续 执 行 了 5 次 stepi 命令 ,语句 for(i=0;i<n;i 十 十 ) 才 执行 完 , 最 
后 ,gdb 提示 下 一 条 要 执行 的 语句 是 sum 十 一 i。 


2.4 make 和 Makefile 


当 一 个 项 目 组 所 开发 的 项 目 包 含 上 百 上 千 甚 至 更 多 文件 时 ,文件 间 的 依赖 关系 会 变 
得 很 复杂 ,如 果 仅 使 用 GCC 工具 来 进行 项 目 编译 ,编译 工作 会 变 得 复杂 和 耗 时 ,特别 仅 当 
修改 了 项 目 中 的 一 个 源 文件 时 ,即使 最 有 耐心 的 程序 员 也 不 想 重 新 编译 所 有 的 源 文件 。 
make 工具 可 以 解决 这 些 问 题 , 它 会 根据 Makefile 文件 中 定义 的 规则 自动 执行 编译 工作 ， 
用 户 只 需 执行 一 条 简单 的 make 命令 ,同时 make 还 会 在 必要 时 仅 重新 编译 所 有 受 改动 影 
响 的 源 文件 ,从 而 减少 了 项 目 重 新 编译 的 工作 量 。 
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在 C 语言 开发 的 大 型 软件 中 都 包含 很 多 源 文件 和 头 文件 ,这 些 文件 间 通 常 彼此 依 
赖 , 且 关 系 复杂 。 如 果 用 户 修改 了 其 中 一 个 文件 , 则 必须 重新 编译 所 有 依赖 它 的 文件 。 

例如 , 当 程 序 由 多 个 源 文件 组 成 时 , 若 这 些 文件 都 引用 了 同一 个 头 文件 ,那么 修改 了 
这 个 头 文件 ,就 必须 重新 编译 每 个 源 文 件 。 

编译 过 程 分 为 编译 .汇编 .链接 等 阶段 。 其 中 ,编译 阶段 仅 检 查 语法 错误 ,链接 阶段 则 
主要 完成 函数 链接 和 全 局 变量 的 链接 。 因 此 ,那些 没有 改动 的 源 代码 是 不 需要 重新 编译 
的 ,只 是 把 它们 重新 链接 就 可 以 了 。 怎 样 才能 只 编译 那些 更 新 过 的 源 代码 文件 呢 ?” 此 时 
可 以 使 用 GUN 的 make 工程 管理 器 。 

make 工程 管理 器 是 一 个 “自动 编译 管理 器 ”, 这 里 的 “自动 ”是 指 它 能 够 根据 文件 的 时 
间 戳 自动 发 现 更 新 过 的 文件 而 减少 编译 的 工作 量 。 同 时 , 它 通 过 读 入 Makefile 文件 的 内 
容 来 执行 编译 工作 ,只 需 用 户 在 最 初时 设置 一 些 简单 的 编译 语句 即 可 ,显著 地 提高 了 工作 

make 工具 提供 灵活 的 机 制 来 建立 大 型 的 软件 项 ,make 工具 依赖 一 个 特殊 的 、 名 字 为 
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makefile 或 Makefile 的 文件 ,这 个 文件 描述 了 系统 中 各 个 模块 之 间 的 依赖 关系 。 当 工程 
中 的 某 些 文件 发 生 改 变 时 ,make 将 会 根据 Makefile 文件 中 描述 的 关系 确定 一 个 需要 重 
新 编译 的 文件 的 最 小 集合 。 如 果 一 个 工程 包括 几 十 个 甚至 更 多 的 源 文 件 或 可 执行 文件 ， 
这 时 make 工具 特别 有 用 。 

1. make 的 基本 工作 原理 

为 了 说 明 make 的 基本 工作 原理 ,本 节 假 设 有 一 个 包含 4 个 源 文 件 的 工程 ,这 4 个 源 
文件 分 别 为 1.c、2.c、3.c 和 4.c, 它 们 最 终 链 接 并 生成 可 执行 文件 demo, 如 图 2. 10 所 示 。 

在 开发 的 过 程 中 ,程序 设计 者 对 2. c 源 文件 进行 了 修改 ,那么 为 了 在 最 终 的 demo 可 
执行 文件 中 体现 出 来 ,必须 重新 编译 生成 2. o, 然 后 重新 编译 链接 并 生成 新 的 demo 文件 。 
在 此 过 程 中 ,其 他 未 经 修改 的 文件 以 及 它们 的 目标 文件 都 不 需要 改动 ,如 图 2. 11 所 示 。 


1.c 2.c 3c 4c l.c 2.c 3c 4c 
| d Ll dk d 
Lo 2.0 3.0 4.0 Lo 2.0 3.0 4.0 


1 i 
demo demo 
图 2.10 由 4 个 源 文件 产生 的 demo 图 2.11 修改 2.c 后 的 demo 


通过 图 2. 11 可 以 很 清楚 地 分 辨 出 哪些 文件 需要 重新 编译 或 链接 。 如 果 将 所 有 文件 
重新 编译 一 次 也 是 可 以 的 ,但 是 如 果 一 个 工程 由 上 千 万 个 源 文件 组 成 ,例如 Linux 源码 ， 
就 必须 精心 地 挑选 出 需要 重新 编译 的 文件 ,否则 重新 编译 所 有 源 文件 将 会 浪费 大 量 时 间 ， 
是 不 现实 的 。 
使 用 make 工具 后 , 它 根据 每 个 源 文件 的 时 间 惟 进行 判断 。 每 个 源 文件 都 会 记录 其 
最 近 修改 的 时 间 , 即 时 间 蕉 。make 对 比 源 文件 及 其 所 生成 的 目标 文件 的 时 间 截 ,判断 它 
们 的 新 旧 关系 ,从 而 决定 是 否 需 要 编译 。 例 如 ， 
程序 设计 者 刚刚 修改 了 源 文件 2.c, 那 么 它 的 时 
间 攻 将 会 被 更 新 为 当前 最 新 的 系统 时 间 ,make | | | d ] 
ROBUR IM DL T ENERALE 2.0. [io] [29] [30 SL um 
要 新 ,因此 在 需要 使 用 2, o 时 就 会 自动 重新 编译 “一 一 一 一 一 一 一 
生成 2.0, 这 又 会 导致 2. o 的 时 间 戳 比 demo 新 ， 
于 是 demo 也 会 被 自动 重新 编译 ,这 种 递 推 关系 
会 在 每 一 层 目标 -依赖 之 间 传递 ,如 图 2. 12 pg, 图 2. 12 Makefile 眼中 的 目标 和 依赖 关 系 
在 以 上 示例 中 ,demo 是 最 终 的 目标 , 它 依赖 
于 4 个 可 重 定位 文件 ,而 对 于 每 一 个 可 重 定位 文件 而 言 ,它们 本 身 也 都 是 目标 ,依赖 于 对 
应 的 . c 源 文件 。 在 make 的 过 程 中 ,每 个 文件 都 存在 于 类 似 的 一 层 层 的 目标 -依赖 关系 
中 ,通过 对 比 目 标 文件 和 依赖 文件 的 时 间 蕉 来 决定 下 一 步 动作 ,这 就 是 make 最 基本 的 工 
作 原 理 。 


Le 2e 3e 4c|-- 依赖 
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2. make 命令 格式 
mke DEM] fmake 工 程 文件 ] 


常用 选项 : 
。-d: 显示 调试 信息 。 
-f: 文件 此 选项 告诉 make 使 用 指定 文件 为 依赖 关系 文件 ,而 不 是 默认 的 Makefile 
或 makefile, 如 果 指 定 的 文件 名 是 “-”, 那 么 make 将 从 标准 输入 读 和 信 依赖 关系 。 

* -n: 不 执行 Makefile 中 的 命令 ,只 是 显示 输出 这 些 命令 。 

。 -s: 执行 但 不 显示 任何 信息 。 

3. make 规则 

GUN make 的 主要 功能 是 读 入 一 个 文本 文件 Makefile, 并 根据 Makefile 的 内 容 执行 
一 系列 的 工作 。Makefile 的 默认 文件 名 为 GUNmakefile,makefile 或 Makefile, 也 可 以 在 
make 命令 行 中 指定 其 他 的 文件 名 。 如 无 特别 指定 ,make 命令 在 执行 时 将 按 顺 序 查找 默 
认 的 Makefile 文件 ,多 数 Linux 程序 设计 者 使 用 第 三 种 文件 名 ( 即 Makefile)。 

Makefile 是 一 个 文本 形式 的 数据 库 文件 ,其 中 包含 一 些 规则 ,告诉 make 处 理 哪些 文 
件 以 及 如 何 处 理 这 些 文件 。 这 些 规则 主要 用 来 描述 哪些 文件 ( 称 为 target 目标 文件 ,与 编 
译 时 产生 的 目标 文件 概念 不 同 ) 是 从 哪些 别 的 文件 ( 称 为 dependency 依赖 文件 ) 中 产生 
的 ,以 及 用 什么 命令 (command) 来 执行 这 个 过 程 。 

依靠 这 些 信息 ,make 会 对 磁盘 上 的 文件 进行 检查 ,如 果 目 标 文件 在 生成 或 被 改动 时 
的 时 间 ( 文 件 时 间 戳 ) 至 少 比 它 的 一 个 依赖 文件 还 旧 的 话 ,make 就 执行 相应 的 命令 更 新 目 
标 文件 。 目 标 文件 不 一 定 是 最 后 的 可 执行 文件 , 它 可 以 是 任何 一 个 中 间 文 件 并 可 以 作为 
其 他 目标 文件 的 依赖 文件 。 

一 个 Makefile 文件 主要 含有 一 系列 的 make 规则 ,每 条 make 规则 包含 以 下 内 容 : 

目标 文件 列表 : 依赖 文件 列表 

<TPB> 命 令 列 表 


Hop: 
* 目标 (target) 文 件 列表 : 即 make 最 终 需要 创建 的 文件 ,中 间 用 空格 隔 开 ,如 可 执 
行文 件 和 目标 文件 ;目标 文件 列表 也 可 以 是 要 执行 的 动作 ,如 “clean”。 
。 依赖 文件 (dependency) 列 表 : 通常 是 编译 目标 文件 所 需要 的 其 他 文件 。 
* 命令 (command) 列 表 : 是 make 执行 的 动作 ,通常 是 把 指定 的 相关 文件 编译 成 目 
标 文件 的 编译 命令 。 每 个 命令 占 一 行 , 且 每 个 命令 行 的 起 始 字符 必须 为 TAB F 
符 ( 制 表 符 ) 。 
除非 特别 指定 ,make 的 工作 目录 就 是 当前 目录 。target 是 需要 创建 的 二 进 制 文件 或 
目标 文件 。dependency 是 在 创建 target 时 需要 用 到 的 一 个 或 多 个 文件 的 列表 。 命 令 序 
列 是 创建 target 文件 所 需要 执行 的 步骤 ,比如 编译 命令 。 
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下 面 通 过 示例 程序 2.2 来 了 解 Makefile 文件 的 编写 。 此 处 仍然 使 用 图 2. 10 所 示 的 
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工程 demo 来 讲述 Makefile 文件 的 基本 编写 方法 ,以 及 make 工具 如 何 按 Makefile 文件 
内 容 执 行 任 务 的 过 程 。 

工程 demo 除了 包含 原 有 的 1.c、2.c、3.c 和 4.c 等 4 个 源 文件 ,现在 增加 a.h、b.h 和 
c. h 等 3 个头 文件 ,通过 编译 链接 后 形成 可 执行 文件 demo。3 个 头 文件 a. hib. h、c.h 内 
容 为 空 , 可 以 使 用 touch 命令 来 创建 它们 。 

操作 步骤 如 下 : 

步骤 1 程序 分 析 , 分 割 文件 。 

demo 工程 包含 的 4 个 源 文件 和 3 个 头 文件 内 容 信息 如 下 : 


[示例 程序 2.2] 
/A. c 源 文件 内 容 
# include< stdlib.h> 
# include "a.h" 


extern void function one(); 
extern void function two(); 
extern void function three(); 


int main() 

t 
function one(); 
function two); 
function three(); 
exit(EXIT SUCCESS); 

} 


112. c 源 文件 内 容 
# include "a.h" 
f include "p.h" 


void function one()( 
H 


113. c 源 文件 内 容 
# include "p.h" 
f include "c.h" 


void function two()( 
} 


//4. c 源 文件 内 容 
# include "c.h" 
# include "a.h" 
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void function three()( 

} 

步骤 2 编辑 Makefile 文件 。 

Makefile 是 文本 形式 的 数据 库 文 件 ,因此 可 以 使 用 vim 工具 进行 编辑 。 在 Makefile 
中 ,可 使 用 续 行 号 “\” 将 一 个 单独 的 命令 行 延续 成 几 行 ,但 要 注意 在 续 行 号 “\” 后 面 不 能 跟 
任何 字符 (包括 空格 键 ) 。 


root@ubuntu:# vim Makefile 


Makefile 内 容 如 下 (为 了 方便 读者 理解 ,在 Makefile 文件 内 容 前 增加 了 行 号 ,实际 编 
写 Makefile 文件 内 容 不 加 行 号 ) : 


demp:1.o 2.0 3.0 4.0 
制 表 符 ”gcc 1.0 2.0 3.0 4.0 - o demo 


1.0:1.c a.h 


1 

2 

3 

4 

5 goc l.c-ol.o-c 
6  2.0:2.c a.h b.h 

7 goc 2.c-02.0-c 
8  3.0:3.c b.h c.h 

9 goc 3.c-03.0-c 
10 4.o:4.c c.h a.h 


11 gcc 4.c -o 4.0 -c 
12 clean: 
13 m-f*.o 


这 个 Makefile 文件 总 共有 13 £p .6 套 规 则 ,分 别 是 1 与 2,4 与 5,6 53 7.8 59,10 与 
11,12 与 13。 其 中 第 一 行 的 demo 是 第 一 个 目标 ,冒号 后 面 是 这 个 目标 的 依赖 关系 列表 
(4 T. o 可 重 定位 文件 )。 第 2 行 行 首 是 一 个 制 表 符 ,注意 不 要 使 用 空格 , 制 表 符 告诉 
make 后 面 紧 跟 着 的 是 一 句 Shell 命令 。 

下 面 第 4 一 11 行 ,也 都 是 目标 -依赖 关系 对 及 其 相关 的 Shell 命令 ,这 里 需要 注意 的 
是 ,Makefile 文件 共有 6 个 目标 ,但 是 第 一 个 规则 的 目标 (demo) 称 为 终极 目标 ,终极 目标 
指 的 是 当前 执行 make 时 默认 生成 的 那个 文件 ,如 果 第 一 个 规则 有 多 个 目标 , 则 只 有 第 一 
个 才 是 终极 目标 。 

下 面 第 12 行 和 第 13 行 ,也 都 是 目标 -依赖 关系 对 及 相关 的 Shell 命令 ,其 中 clean 是 
一 个 常用 的 专用 目标 ,无 依赖 关系 ,相关 的 Shell 命令 是 删除 当前 目录 所 有 的 . o 文件 。 

步骤 3 用 make 命令 编译 程序 。 

编写 好 Makefile 文件 后 ,用 make 命令 进行 编译 。 命 令 格式 为 : 


root@ubuntu:# make target 


target 是 Makefile 文件 中 定义 的 目标 之 一 :一 定 要 确保 在 Makefile 文件 中 对 target 
进行 了 定义 ,否则 make 命令 会 报错 。 如 果 省 略 target. make 命令 将 生成 Makefile 文件 
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中 定义 的 第 一 个 目标 ,对 于 本 例 ,单独 的 一 个 make 命令 等 价 于 : 
rooteubuntu:#make deno 


用 户 也 可 以 使 用 “make -f Makefile 文件 名 ”运行 make 命令 ,指定 Makefile 文件 需要 
在 make 后 面 加 参数 -{。 如 : 


rootubuntu:é make - f Makefile 
执行 make 命令 后 的 结果 如 下 : 


gccl.c-ol.o-c 
goc 2.c -02.0 - c 
gcc 3.c -03.0 - c 
gcc 4.c -o 4.0 -c 
gcc 1.o 2.0 3.0 4.0 - o demo 


从 make 命令 运行 的 结果 看 来 ,make 命令 根据 Makefile 文件 规则 的 描述 首先 编译 的 
是 1. c, 接 着 分 别 编译 2. 0,3. c 和 4.c, 最 后 根据 第 一 个 规则 的 文件 依赖 关系 生成 demo 
文件 。 
具体 make 命令 的 工作 流程 如 下 : 
* make 在 当前 目录 下 查找 名 为 “Makefile 文件 ”“GNUmakefile 文件 ”makefile X 
YE” aR“ Makefile X fF 3e "* GNUmakefile 3c f/FJe "* makefile 文件 夹 ”的 文件 。 
如 果 找 到 ,make 会 找到 文件 中 的 第 一 个 目标 文件 (target) 。 在 上 面 示 例 中 , 它 会 
找到 demo 这 个 文件 ,并 把 这 个 文件 作为 最 终 的 目标 文件 (target) ,所 有 后 面 的 目 
标的 更 新 都 会 影响 到 demo 的 更 新 ;如 果 demo 文件 不 存在 ,或 demo 所 依赖 的 . o 
文件 的 修改 时 间 要 比 demo 新 , 它 就 会 执行 后 面 所 定义 的 命令 来 生成 demo 文件 。 
如 果 demo 所 依赖 的 . o 文件 存在 ,make 会 在 当前 文件 中 顺序 找到 . o 文件 的 依赖 
性 ,如 果 找 到 , 则 会 根据 规则 生成 .o 文件 。 比 如 demo 第 一 个 的 依赖 文件 是 1. o， 
找到 1. o 的 规则 ,是 第 二 套 规 则 ,1.o 文件 依赖 1. c 和 a.h, 根 据 第 二 套 规则 对 应 
的 命令 "gcc 1.c -o 1.o -c” 来 生成 1.0 文 件 。 
* RE FOE make 以 同样 的 方法 ,对 demo 的 依赖 文件 2.o,3.o 和 4.o 做 类 似 的 检查 ， 
当 make 执行 完 所 有 这 些 舱 套 规则 后 ,make 将 处 理 最 顶层 的 demo 规则 。 执 行 
"gcc 1.0 2.o 3. 0 4. o -o demo” fi GH 1.0、2.0 、3.0 和 4.0o 连接 成 目标 文件 
demo。 
本 例 中 ,一 开始 所 有 的 . o 文件 都 是 不 存在 的 ,因此 会 执行 第 5 行 . 第 7 行 . 第 9 行 、 第 
11 行 ,分 别 生产 1.0,2.0,3. 0 和 4.o, 之 后 ,将 会 执行 第 2 行 生成 最 终 目 标 文件 demo。 随 
后 如 果 对 任何 一 个 源 文件 进行 了 修改 (如 2. c) ,执行 make 时 将 会 发 现 其 对 应 的 . o 文件 
(2.o) 比 依赖 文件 2. c 旧 , 因 此 会 自动 重新 编译 (第 7 行 ), 然 后 根据 一 样 的 原理 ,终极 目标 
文件 demo 也 被 重新 编译 。 
使 用 “make clean” 命 令 ,可 以 删除 当前 目录 中 所 有 的 . o 文件 。 命 令 及 结果 如 下 : 


Iooteubuntu:# make clean 
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m-f*.o 
也 可 以 使 用 “make 2. o” ,创建 目 标 体 (target)2. 0 文件 。 命 令 及 结果 如 下 : 


root&ubuntu:f make 2.0 

go 2.c -o0 2.0 -c 

步骤 4 查看 demo 文件 是 否 成 功 生 成 。 

使 用 1s 命令 查看 当前 目录 下 的 文件 ,发 现 demo 可 执行 文件 已 经 成 功 生成 。 


root@ubuntu:# ls 
l.c l.o 2.c 2.0 3.c 3.0 4.c 4.o ah bh ch dem Makefile 


从 终端 显示 效果 看 ,demo 目标 文件 已 生成 。 
步骤 5 修改 文件 ,运行 make, 
修改 b. h, 重 新 运行 make 命令 ,如 下 : 


root@ubuntu:# touch b.h 
root(ubuntu:f make - f Makefile 
gcc 2.c -02.0- c 

gcc 3.c -03.0 - c 

gcc 1.0 2.0 3.0 4.0 - o demo 


make 命令 读 取 Makefile 文件 ,确定 重建 demo 所 需 的 最 小 命令 集合 ,并 以 正确 的 顺 
序 执行 它们 。 因 b. h 修改 了 ,因此 make 发 现 依赖 b.h 的 2.o 和 3.o 的 时 间 戳 比 b.h 的 
时 间 戳 旧 , 运 行 “gcc 2. c -o 2.o -c” 和 “gcc 3. c -o 3.0 -c” 命 邻 重 编译 生成 2.o 和 3. o, A 
2. o 和 3.o 相对 demo 文件 时 间 戳 新 ,因此 运行 gcc 1.o 2. 0 3. 0 4. o -o demo 重新 编译 
demo, 

删除 目标 文件 2. o, 重 新 运行 make 命令 如 下 : 

root@ubuntu:# rm 2.0 

root@ubuntu:# make - f Makefile 

gcc 2.c -0 2.0-0 

gcc 1.o 2.0 3.0 4.0 - o demo 

首先 删除 了 2. o, 之 后 运行 make 命令 ,发 现 demo 的 依赖 文件 2.0 不 存在 。 因 此 , 寻 
找 2. o 目标 对 应 的 规则 ,运行 命令 "gcc 2. c -o 2.0 -c”, 编 译 生成 2.o。 之 后 运行 命令 “gcc 
1.o 2.o 3. 0 4. o -o demo" E 4j HE ^E JV, demo 文件 。 


2.5 小 结 


本 章 是 对 Linux 下 C 语言 开发 工具 的 介绍 ,根据 程序 开发 的 过 程 ,首先 介绍 了 Linux 
下 的 一 些 常用 的 源 代码 编辑 器 ,作为 读者 选择 合适 自己 的 编辑 器 参考 ,其 中 重点 对 广泛 使 
用 的 vim 编辑 器 ,及 它 的 具体 使 用 方法 和 一 些 使 用 技巧 进行 了 介绍 。 接 下 来 ,介绍 了 知 
名 的 gcc 编译 器 及 使 用 方法 ;程序 编写 过 程 的 错误 诊断 需要 调试 器 的 支持 ,本 章 对 使 用 广 
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泛 且 安装 方便 的 gdb 调试 器 进行 了 介绍 。 最 后 对 于 大 型 项 目的 开发 ,如 何 进行 有 效 而 且 
方便 的 编译 ,介绍 了 make 工具 的 使 用 方法 及 Makefile 文件 的 基本 编写 规则 。 通 过 本 章 
的 学 习 , 读 者 可 以 掌握 一 套 完整 的 C 语言 开发 工具 的 使 用 方法 。 


习 题 

一 、 填空 题 

1. 在 Linux 环境 下 不 使 用 集成 的 IDE 时 ,编辑 C 源 程序 文件 可 使 用 ,编译 
该 文件 可 使 用 ,调试 可 使 用 

2. 需要 使 用 gdb 调试 程序 前 ,使 用 gcc 编译 程序 需要 加 入 选项 。 

3. gdb 环境 中 ,运行 程序 使 用 命令 , 单 步 执行 程序 使 用 命令 ,查看 
变量 类 型 使 用 命令 ,退出 gdb 环境 使 用 命令 。 

4. Makefile 文件 中 make 规则 的 格式 为 ,在 使 用 make 自动 编译 项 目 时 , 判 
断 某 个 文件 是 否 需 要 重新 编译 的 标准 是 

二 、 简 答题 


1. vim 编辑 器 有 哪 几 种 工作 模式 ? 

2. 在 vim 编辑 器 中 ,改动 文件 的 一 些 内 容 ,但 退出 时 不 想 保存 所 修改 的 部 分 ,如 何 进 
行 操作 ? 

三 、 编 程 题 

1. 编写 一 求 n 阶乘 的 C 语言 文件 ,使 用 gcc 工具 编译 该 源 程序 并 运行 。 

2. 对 第 1 题 中 求 n 阶乘 文件 设置 断 点 ,使 用 gdb 工具 观察 该 程序 的 递归 调用 过 程 ， 
并 观察 n 的 值 。 

3. 编写 几 个 测试 程序 及 相应 的 Makefile 文件 ,然后 使 用 make 命令 进行 编译 。 


P rad 35 


ET 


文件 及 目录 管理 


Linux 系统 中 一 切 皆 文件 ,不 仅 程序 和 数据 是 以 文件 的 形式 保存 的 ,目录 和 各 种 设备 
也 都 被 当 作 文件 来 使 用 。 本 章 主要 介绍 POSIX 标准 的 系统 1/0 操作 ,而 对 于 标准 1/O 
操作 不 是 本 章 介 绍 的 重点 ,读者 如 果 具 备 C 语言 基础 并 且 理 解 了 本 章 介 绍 的 系统 1/O HE 
口 操 作 , 那 么 理解 标准 1/0 接口 操作 的 使 用 方法 将 不 会 感到 困难 。 系 统 1/O 接口 提供 了 
不 带 缓冲 区 的 IO 操作 ,而 标准 L/O 接口 提供 了 带 缓冲 区 的 1/0 操作 ,两 者 在 使 用 缓冲 
区 方面 有 比较 大 的 区 别 , 因 此 本 章 对 不 带 缓冲 区 和 带 缓冲 区 的 文件 操作 原理 进行 介绍 , 同 
时 描述 了 不 带 缓冲 区 的 文件 描述 符 和 带 缓冲 区 的 流 概 念 。 本 章 加 入 了 一 些 关 于 Linux X 
件 系统 的 相关 知识 介绍 ,使 读者 可 以 对 Linux 系统 下 的 1/0 接口 有 更 深入 的 理解 。 同 
时 ,在 介绍 相关 L/O 接口 时 ,对 涉及 的 一 些 Linux 内 核 数据 结构 和 Linux 操作 系统 文件 管 
理 方法 也 将 进行 介绍 。 


3.1 文件 和 1/0O 操作 分 类 
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在 大 多 数 应 用 中 ,文件 是 一 个 核心 成 分 。 除 了 实时 应 用 和 一 些 特殊 的 应 用 外 ,应 用 程 
序 的 输入 都 是 通过 文件 来 实现 的 。 实 际 上 所 有 应 用 程序 的 输出 都 保存 在 文件 中 ,这 便于 
信息 的 长 期 存储 及 用 户 或 应 用 程序 将 来 的 访问 。 

文件 可 以 认为 是 具有 标识 符 的 一 组 相关 联 信 息 项 的 有 序 集合 ,一 般 体现 为 磁盘 上 的 
文件 。 对 于 文件 的 管理 ,从 Linux 内 核 的 角度 来 看 ,处 理 文件 的 部 分 是 文件 系统 , Linux 
内 核 通 过 文件 系统 对 文件 存储 器 空间 进行 组 织 和 分 配 ,负责 文件 的 存储 并 对 存 和 人 的 文件 
进行 保护 和 检索 。 具 体 地 说 , 它 负 责 为 用 户 建立 文件 . 存 入 、 读 出 ,修改 、 转 储 文件 ,控制 文 
件 的 存 取 , 当 用 户 不 再 使 用 时 撤销 文件 等 。 从 用 户 的 角度 来 看 ,文件 的 管理 是 通过 Linux 
操作 系统 提供 的 一 系列 接口 完成 的 ,比如 系统 I/O、 标 准 MO、 字符 命令 和 图 形 接口 来 完 
成 文件 的 管理 。 
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根据 应 用 程序 对 文件 的 访问 方式 , 即 是 否 使 用 缓冲 区 ,对 文件 的 访问 可 分 为 不 带 缓冲 
区 的 文件 操作 和 带 缓冲 区 的 文件 操作 。 这 里 所 说 的 缓冲 区 有 别 于 操作 系统 内 核 中 的 磁盘 
缓冲 ,磁盘 缓冲 是 为 提高 磁盘 访问 速度 而 专门 开辟 的 内 存 空间 。 
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。 不 带 缓冲 区 的 文件 操作 。 属 于 低级 文件 操作 ,需要 用 户 在 自己 的 程序 中 为 每 个 文 
件 设置 缓冲 区 ,如 图 3. 1 所 示 , 对 文件 进行 读 写 操作 时 ,数据 从 磁盘 输入 到 用 户 程 
序 的 数据 区 之 前 或 数据 从 用 户 程序 的 数据 区 输出 到 磁盘 之 前 ,都 不 会 经 过 系统 管 
理 的 输出 缓冲 区 进行 缓冲 。 遵 循 POSIX 标准 的 系统 L/O 使 用 的 就 是 不 带 缓冲 区 
的 文件 操作 ,系统 LO 接口 也 称 为 IO 系统 调用 , 如 open, read, write 和 
lseek 等 。 

带 缓冲 区 的 文件 操作 。 属 于 高 级 文件 操作 ,系统 将 在 用 户 空间 中 自动 为 正在 使 用 
的 文件 开辟 内 存 缓冲 区 ,如 图 3. 2 所 示 ,数据 在 从 文件 读 到 程序 数据 区 和 从 程序 
数据 区 输出 到 文件 的 过 程 中 ,将 会 经 过 一 个 系统 管理 的 输入 或 输出 缓冲 区 进行 组 
冲 。 遵 循 ANSI 标准 的 1/0 操作 使 用 的 就 是 带 缓冲 区 的 文件 操作 ,标准 1/0 接口 
也 称 为 L/O EŠ, WN fopen, fread, fwrite, flush 和 fseek 等 。 
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图 3.1 不 带 缓冲 区 的 文件 操作 图 图 3.2 带 缓冲 区 的 文件 操作 
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在 第 1 章 中 已 经 了 解 到 系统 调用 和 库 函 数 的 本 质 区 别 ,调用 系统 调用 会 陷入 Linux 
内 核 ,而 调用 库 函 数 不 会 陷入 Linux 内 核 。 如 果 采 用 非 缓 冲 区 的 文件 访问 方式 ,每 次 在 对 
文件 进行 任何 一 次 读 或 写 操作 时 ,分 别 使 用 读 文件 的 系统 调用 read 来 处 理 读 操作 ,或 使 
用 写 文 件 的 系统 调用 write 来 处 理 写 操作 。 如 果 用 户 程 序 需要 访问 磁盘 空间 中 的 某 个 文 
件 ,read 或 write 是 以 一 个 数据 单元 为 单位 进行 读 或 写 操作 ,因此 ,一 个 文件 的 读 或 写 操 
作 可 能 需要 多 次 调用 read 或 write 系统 调用 完成 。 一 个 文件 长 度 可 能 被 划分 成 多 个 数据 
单元 ,每 访问 一 个 数据 单元 都 要 执行 一 次 系统 调用 ,执行 系统 调用 会 有 一 次 用 户 态 到 内 核 
态 的 切换 ,系统 调用 完成 后 还 会 有 内 核 态 到 用 户 态 的 转换 ,这 两 次 态 式 的 转换 将 涉及 
CPU 状态 的 切换 、 用 户 态 进程 和 系统 进程 的 上 下 文 切换 ,这 将 消耗 一 定 的 CPU 时 间 。 对 
磁盘 读 或 写 操作 是 一 个 机 械 运动 ,相对 CPU 处 理 速 度 来 讲 ,是 一 个 缓慢 的 过 程 ,频繁 的 
磁盘 访问 对 程序 执行 效率 会 造成 较 大 的 影响 。 从 而 可 以 得 到 一 个 结论 ,通过 多 次 调用 
read 或 write 系统 调用 完成 大 文件 数据 的 读 或 写 ,从 效率 角度 来 讲 比 较 低 效 。 

ANSI 标准 L/O 库 函 数 建立 在 底层 系统 调用 之 上 ,在 对 文件 函数 库 的 实现 中 使 用 了 
低级 文件 I/O 系统 调用 。ANSI 标准 C 库 中 的 文件 处 理 函 数 为 了 减少 使 用 系统 调用 的 次 
数 以 及 提高 效率 ,根据 应 用 程序 的 不 同 , 采 用 缓冲 区 机 制 ,这 样 ,对 磁盘 文件 进行 读 或 写 操 
作 时 ,可 以 一 次 性 地 从 文件 中 读 取 大 量 的 数据 到 缓冲 区 中 。 以 后 对 这 部 分 数据 的 访问 就 
不 需要 再 使 用 系统 调用 了 ,因为 数据 可 以 直接 从 输入 文件 缓冲 区 或 输出 文件 缓冲 区 中 获 
得 , 即 整 个 读 或 写 操作 只 需要 少量 的 CPU 状态 的 切换 和 磁盘 的 读 写 机 械 访 问 次 数 。 在 
对 磁盘 写 文件 进行 操作 时 ,可 以 先 将 内 容 存 储 在 文件 缓冲 区 中 ,将 文件 缓冲 区 充满 后 ,或 
者 确实 需要 更 新 的 时 候 再 调用 系统 调用 ,将 该 文件 一 次 性 写 人 到 磁盘 。 

ANSI 标 准 C 库 函数 为 了 实现 这 一 特性 ,采用 了 流 的 概念 ,因为 数据 的 输入 和 输出 
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就 像 流 动 的 水 一 样 。 在 流 的 实现 中 ,缓冲 区 是 最 重要 的 单元 。 根 据 使 用 需求 的 不 同 ， 
可 以 选择 使 用 全 缓冲 区 . 行 缓冲 区 和 无 缓冲 区 等 3 种 缓冲 区 处 理 方式 来 处 理 文件 的 读 
FRE. 


3.2 Linux 文件 系统 概述 


321 文件 结构 


文件 结构 是 文件 存放 在 磁盘 等 存储 设备 上 的 组 织 方法 ,主要 体现 在 对 文件 和 目录 的 
组 织 上 。Linux 操作 系统 使 用 标准 的 目录 结构 , 它 提供 了 一 个 方便 有 效 地 管理 文件 的 途 
径 。 在 安装 Linux 的 时 候 ,安装 程序 就 会 为 用 户 创建 文件 系统 和 完整 而 固定 的 目录 组 成 
形式 ,并 指定 了 每 个 目录 的 作用 和 其 中 的 文件 系统 ,如 图 3. 3 所 示 。 


/ RER) 


bin boot dev etc home lib proc root sbin tmp usr var 


图 3.3 Linux 目录 树 结构 


文件 主要 包含 两 方面 的 内 容 : 一 是 文件 本 身 所 包含 的 数据 ; 另 一 个 是 文件 的 属性 ,也 
称 为 元 数据 ,一 般 包 括 文 件 访问 权限 .所 有 者 文件 大 小 和 创建 日 期 等 信息 。 

目录 也 是 一 种 文件 , 称 为 目录 文件 , 它 的 内 容 是 该 目录 的 目录 项 。 目 录 项 是 该 目录 下 
各 个 文件 和 目录 的 相关 信息 。 当 创建 一 个 新 目录 时 ,系统 将 自动 创建 两 个 目录 项 “.” 和 
“..”,“, ”代表 当前 目录 ,“..” 代 表 当 前 目录 的 父 目录 ,在 Shell 下 输入 Is -a 命令 可 以 将 其 
显示 在 终端 上 。 对 于 根 目录 ,两 者 是 相同 的 。 

在 Shell 环境 下 输入 cd /可 以 切换 到 根 目录 ,再 输入 ls 命令 可 以 查看 到 根 目录 下 的 
目录 情况 ,常见 的 Linux 系统 发 行 版 本 都 包含 有 如 下 几 个 目录 。 

。 /bin: 用 于 存放 普通 用 户 可 执行 的 命令 ,系统 中 的 任何 用 户 都 可 以 执行 该 目录 中 
的 命令 ,如 Is, cp, mkdir 等 命令 。 
/boot: Linux 内 核 及 启动 系统 时 所 需要 的 文件 ,为 保证 启动 文件 更 加 安全 可 靠 ， 
通常 把 该 目录 存放 在 独立 的 分 区 上 。 
/dev: 设备 文件 的 存储 目录 ,如 磁盘 、 光 盘 等 。 
/etc: 用 于 存放 系统 的 配置 文件 , 比如 用 户 账 号 及 密码 存放 在 配置 文件 /etc/ 
password 和 /etc/shadow 中 。 
/home: 普通 用 户 的 主 目录 ,每 个 用 户 在 该 目录 下 都 有 一 个 与 用 户 同名 的 目录 。 
/lib: 用 于 存放 各 种 库 文件 。 
/proc: 该 目录 是 一 个 虚拟 文件 系统 ,只 有 在 系统 运行 时 才 存 在 。 通 过 访问 该 目录 
下 的 文件 ,可 以 获取 系统 状态 信息 并 且 修 改 某 些 系 统 的 配置 信息 。 可 以 使 用 cat, 
strings 命令 来 查看 这 些 信 息 , 如 在 Shell 下 输入 cat/proc/meminfo 命令 可 以 获取 
系统 内 存 的 使 用 情况 ,输入 man proc 命令 获取 关于 proc 的 详细 信息 。 
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* /root; 超级 用 户 root 的 主 目录 。 

。 /sbin: 存放 的 是 用 于 管理 系统 的 命令 。 

。 /tmp: 存放 的 是 临时 文件 。 

。 /usr: 用 于 存放 系统 应 用 程序 及 相关 文件 ,如 说 明文 档 、 帮 助 文件 等 。 
。 /var: 用 于 存放 系统 中 经 常 变化 的 文件 ,如 日 志文 件 、 用 户 邮件 等 。 


322 文件 系统 模型 


文件 的 本 质 就 是 长 期 存储 在 物理 磁盘 上 的 数据 ,操作 系统 通过 文件 系统 功能 可 以 方 
便 地 对 磁盘 上 的 文件 进行 管理 。Linux 的 文件 系统 模型 如 图 3. 4 所 示 。 


用 户 用 户 程序 文件 设备 API 
T T 


Miu T E-- 


内 核 虚拟 文件 系统 


具体 的 文件 系统 
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设备 驱动 


c 


图 3.4 文件 系统 模型 


对 物理 磁盘 的 访问 都 是 通过 设备 驱动 程序 进行 的 ,而 对 设备 驱动 的 访问 则 有 两 种 途 
径 : 一 种 是 通过 设备 驱动 本 身 提 供 的 接口 : 另 一 种 是 通过 虚拟 文件 系统 (Virtual File 
System,VFS) 提 供给 上 层 应 用 程序 的 接口 。 第 一 种 方式 能 够 让 用 户 进程 绕 过 文件 系统 
直接 读 写 磁盘 上 的 内 容 , 这 给 操作 系统 带 来 了 不 稳定 性 ,因此 大 部 分 操作 系统 Linux 都 是 
使 用 虚拟 文件 系统 来 访问 设备 驱动 的 。 只 有 在 特殊 情况 下 才 人 允许 用 户 进程 通过 设备 驱动 
接口 直接 访问 物理 磁盘 。 

VFS 是 虚拟 的 .不 存在 的 , 它 与 前 面 提 到 的 proc 文件 系统 一 样 ,都 只 存在 于 内 存 而 不 
存在 于 磁盘 中 , 即 只 有 在 系统 运行 后 才 存在 。VFS 提供 一 种 机 制 , 它 将 各 种 不 同 的 文件 
系统 整合 在 一 起 ,并 提供 统一 的 应 用 程序 接口 (API) 供 上 层 的 应 用 程序 使 用 。VFS 的 使 
用 体现 了 Linux 的 最 大 特点 之 一 : 支持 多 种 不 同 的 文件 系统 。Linux 不 仅 支持 EXT2、 
EXT3 ,也 支持 Windows 系统 的 文件 系统 。 

从 硬盘 的 构造 可 知 , 访 问 物理 磁盘 的 最 小 单位 是 位 于 某 个 盘面 上 某 个 磁道 的 一 个 扇 
区 ,即使 用 户 只 需 访问 1 个 字 节 的 数据 ,实际 读 写 时 都 需要 先 将 该 字 节 所 在 的 鹿 区 读 和 人 到 
内 存 , 然 后 再 选择 指定 的 数据 进行 访问 。 因 此 ,文件 系统 是 由 一 系列 的 块 (block) 构 成 的 ， 
每 个 块 的 大 小 因 文件 系统 不 同 而 不 同 ,但 文件 系统 一 旦 安装 之 后 ,其 块 的 大 小 就 固定 了 。 
通常 一 个 块 的 大 小 是 一 个 扇 区 的 大 小 。 
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323 目录 ,索引 结 点 和 文件 描述 符 


1. 目录 和 索引 结 点 

为 了 能 对 一 个 文件 进行 正确 的 存 取 ,必须 为 文件 设置 用 于 描述 和 控制 文件 的 数据 结 
Vg , 称 为 文件 控制 块 (File Control Block, FCB) ,文件 管理 程序 (内 核 ) 可 借助 文件 控制 块 
中 的 信息 对 文件 施 以 各 种 操作 。 

每 个 文件 都 有 一 个 FCB 用 于 描述 文件 的 各 种 属性 信息 ,FCB 的 有 序 集 称 为 文件 目 
Ro 一 个 FCB 也 称 为 一 个 目录 项 ,为 实现 对 文件 目录 的 管理 ,通常 将 文件 目录 以 文件 的 
形式 保存 在 外 存 上 ,这 个 文件 就 称 为 目录 文件 。FCB 一 般 包含 三 类 信息 : 第 一 类 为 基本 
信息 ,如 文件 名 ,文件 物理 位 置 .文件 逻辑 结构 和 文件 物理 结构 ;第 二 类 为 存 取 控 制 信息 ， 
如 文件 所 有 者 存 取 权限 、 所 有 者 所 在 组 的 存 取 权限 、 其 他 用 户 存 取 权限 ;第 三 类 为 信息 类 ， 
如 文件 建立 日 期 和 时 间 ,文件 上 一 次 修改 日 期 和 时 间 、 当 前 使 用 信息 项 (已 打开 该 文件 的 
进程 数 ,是 否 被 其 他 进程 锁 住 ,文件 在 内 存 中 是 否 已 被 修改 但 尚未 复制 到 磁盘 上 )。 

在 现代 操作 系统 中 ,一 般 为 了 加 快 文件 的 检索 速度 ,将 除 文件 名 之 外 的 一 些 属 性 信 
息 ,如 文件 创建 /修改 日 期 ,文件 访问 权限 .文件 长 度 和 文件 在 磁盘 上 的 存放 位 置 等 信息 存 
储 在 一 个 特殊 的 索引 结 点 (inode) 数 据 块 中 ,因此 每 个 文件 都 有 一 个 inode, Linux 的 文 
件 系统 把 所 有 的 inode 组 织 成 一 个 数组 ,给 每 个 inode 分 配 一 个 号 码 , 也 就 是 该 inode 在 
数组 中 的 索引 号 , 称 为 索引 结 点 编号 。Linux 将 FCB( 对 应 内 核 的 dentry 结构 体 ) 组 织 为 
“文件 名 ,索引 结 点 编号 ”这 样 的 结构 ,如 表 3. 1 所 示 , 表 中 每 一 行 对 应 一 个 文件 的 FCB， 
通过 索引 结 点 编号 ,内 核 可 以 找到 文件 对 应 的 索引 结 点 inode, 通 过 inode 可 以 了 解 文件 
的 诸多 属性 ,包括 文件 数据 在 外 设 的 物理 位 置 。Linux 中 一 切 皆 文件 ,每 个 文件 或 目录 都 
对 应 一 个 索引 结 点 ,因此 对 应 上 层 目录 和 本 层 目录 “..” 和 ”*. ”也 有 对 应 的 索引 结 点 编号 。 

33.1 Linux 的 文件 目录 


x 件 名 索引 结 点 编号 
2 


bin 3407873 


文件 系统 就 是 靠 这 个 索引 结 点 编号 来 识别 文件 的 ,在 Shell 环境 中 ,可 以 使 用 1s / -ail 
来 查看 文件 的 索引 结 点 编号 ,如 下 : 


root(ubuntu:^ # ls / -ail 
2 drwxr- xr- x 23 root root 4096 3 月 24 16:07 . 
2 drwxr- xr- x 23 root root 4096 3 月 24 16:07 .. 
3407873 drwxr- xr- x 2 root root 4096 10 H 28 2015 bin 
2028 1rwxrwxrwx 1 root root33 10 月 28 2015 initrd.img - > boot/initrd.img- 3.19.0- 31- generic 


从 以 上 运行 结果 可 以 看 出 ,bin 是 一 个 目录 ,而 initrd. img 是 一 个 文件 ,它们 在 目录 文 


件 中 都 有 一 个 与 其 对 应 的 目录 项 (dentry) .有 唯一 的 inode 索引 结 点 。bin 对 应 的 索引 结 
点 编号 是 3407873 ,而 initrd. img 对 应 的 索引 结 点 编号 是 2028。 当 前 目录 “. ”和 上 一 层 目 
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录 “..” 索 引 结 点 编号 都 为 2, 说 明 当 前 目录 是 根 目录 。 

2. 文件 描述 符 

说 到 文件 描述 符 , 不 得 不 提 task. struct 结构 体 。 操 作 系 统 中 ,一 个 处 于 运行 状态 的 
程序 , 称 为 进程 ,为 了 描述 和 控制 进程 的 运行 ,内 核定 义 了 一 个 称 为 进程 控制 块 PCB 
(Process Control Block) 的 数据 结构 ,PCB 中 记录 了 内 核 所 需 的 ,用 于 描述 进程 当前 情况 
以 及 控制 进程 运行 的 全 部 信息 ,在 Linux 中 ,这 个 数据 结构 为 task_struct。 

文件 描述 符 是 一 个 非 负 整 数 ,对 于 内 核 而 言 , 所 有 打开 的 文件 都 通过 文件 描述 符 引 
用 。 当 用 户 程序 需要 访问 文件 时 ,内 核 通过 open, create 等 系统 调用 向 用 户 程序 返回 一 个 
文件 描述 符 ,随后 在 用 户 程序 中 所 有 对 该 文件 的 访问 都 使 用 该 文件 描述 符 。 

那么 ,文件 描述 符 究竟 是 什么 呢 ? 在 内 核 中 打开 的 文件 是 用 file 结构 体 来 表示 的 ,每 
一 个 结构 体 都 会 有 一 个 指针 指向 它们 ,这 些 指针 被 统一 存放 在 一 个 称 为 fd. array 的 数组 
中 ,而 这 个 数组 被 存放 在 一 个 称 为 files_struct 的 结构 体 中 ,该 结构 体 是 进程 控制 块 task_ 
struct 的 重要 组 成 部 分 。 它 们 的 关系 如 图 3. 5 所 示 。 


| 
| | 
| task struct() — files struct(] filet] | 
teste 广 伯 的 描述 符 | | : n | 
s f modi 
| | fd array[] Tipos dentry inode | 
fü-open(testc") [-44--------4-----— 1 Tags " Map teste 
| | ae| | 文件 物 | 1 
| f dentry n 理 位 置 -El 
| m 1d 
用 户 空间 | 内 核 空间 | 
| 1 外 部 设备 
i 


图 3.5 文件 描述 符 含义 


在 图 3. 5 中 ,task_struct 结构 体 中 记录 了 内 核 所 需 的 、 用 于 描述 进程 当前 情况 以 及 控 
制 进程 运行 的 全 部 信息 ,当然 其 中 也 包含 了 进程 在 运行 中 所 有 打开 文件 的 信息 ,这 些 信息 
被 一 个 files 指针 统一 管理 。files 所 指向 的 结构 体 files_struct 中 的 数组 fd_array 是 一 个 
指针 数组 ,用 户 进程 每 一 次 调用 open 函数 都 会 使 得 内 核实 例 化 一 个 file 结构 体 ,并 将 一 
个 指向 该 结构 体 的 指针 依次 存放 在 fd_array 数组 中 ,该 指针 所 占据 的 数组 下 标 将 被 作为 
“文件 描述 符 ” 返 回 给 用 户 进程 ,因此 文件 描述 符 是 从 0 开始 的 非 负 整数 值 。 

结构 体 file 是 内 核 管理 文件 操作 的 重要 的 数据 之 一 ,里 面 存 放 对 该 文件 的 访问 模式 、 
文件 位 置 偏 移 量 . 打 开 模式 .目录 项 dentry 等 信息 。 在 操作 文件 之 前 ,open 系统 调用 参数 
中 指定 的 打开 模式 mode 和 文件 状态 标志 flags 被 记录 在 该 结构 体 中 ,在 操作 文件 过 程 
中 ,文件 相关 的 控制 数据 也 一 并 在 此 管理 。 

通过 file 结构 体 读 者 会 发 现 其 成 员 f dentry 指向 了 该 文件 对 应 的 唯一 的 目录 项 , 即 
前 面 介绍 的 FCB,dentry 结构 体 中 存放 了 表示 文件 inode 结 点 编号 的 成 员 i_inode, 根 据 
i_inode 文件 系统 可 以 在 磁盘 上 找到 该 文件 对 应 的 inode 结 点 ,通过 inode 结 点 中 文件 物 
理 位 置 可 以 访问 到 文件 在 磁盘 上 的 位 置 .这 样 文件 系统 就 可 以 找到 需要 操作 的 文件 。 
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下 面 是 file 结构 体 的 类 型 定义 : 


//fram /usr/src/linux- headers- 3.19.0- 25/include/linux/fs.h 


struct file ( 
union ( 
struct llist node fu list; 
struct rcu head fu rcubead; 
)fu 
struct path f path; // 包 含 dentry Il mt 两 个 成 员 , 用 于 确定 文件 路 径 
struct inode * f inod; //cached value 
const struct file cperations * f gp; /文件 操作 函数 集 
/* 


* Protects f ep links, f flags. 
* Must not be taken fram IRQ context. 


*/ 
spinlock t f lock; 
atcmic long t f count; 
unsigned int f flags; // 由 open 函数 参数 flags 指 定 
fmde t f mode; // 由 open 函数 参数 mode T E 
struct mutex f pos lock; 
loff t f pos; /文件 位 置 偏 移 量 
struct fown struct f owner; 
const struct cred * f cred; 


struct file ra state f ra 


u64 f version; 
# ifdef CONFTG SECURITY 
void * f security; 
# endif 
/* needed for tty driver, and maybe others * / 
void * private data; 


# ifdef OONFIG EFOLL 
/* Used by £s/eventpoll.c to link all the hooks to this file * / 
struct list head f ep links; 
struct list head f tfile llink; 
#endif /x # ifdef CCNFIG EFOLL * / 
struct address space * f mapping; 
) attribute ((aligned(4)));/* lest samething weird decides that 2 is CK * / 


上 述 代 码 中 用 粗 体 标注 出 来 的 f_op、f_flags、f_mode 和 f_pos 是 其 中 重要 的 成 员 。 


f_op 包含 了 该 文件 实际 读 / 写 的 操作 算法 ,这 些 算法 由 文件 所 在 的 设备 驱动 程序 提供 , 设 
备 类 型 不 同 , 驱 动 程序 也 不 尽 相同 ,这 些 差 异性 都 被 封装 在 f_op 里 面 ,应 用 程序 看 到 是 f 
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op 提供 的 统一 接口 ,比如 Iseek read, write,open,mmap 等 。 


f flags 和 f_ mode 的 值 通过 用 户 调用 open 函数 时 的 flags 和 mode 参数 传递 过 来 ,这 
样 就 规定 了 对 文件 访问 的 选项 和 新 建 时 的 初始 权限 ,用 户 对 文件 使 用 的 需求 通过 open 记 
录 到 内 核 文件 fs.h 中 。 

f_pos 指 的 是 当前 对 文件 操作 的 位 置 ,文件 的 起 始 位 置 为 0。 打开 文件 时 ,f_pos 的 值 
通常 为 0, 也 就 是 从 距离 文件 开始 偏 移 量 为 0 的 字 节 开始 读 写 , 读 写 了 n 个 字 节 后 ,内 核 
自动 将 f_pos 的 值 加 n, 使 得 下 次 读 取 该 文件 时 从 第 n 十 1 个 字 节 开始 。 若 文件 以 追加 方 
式 打开 , 则 £ pos 指向 文件 尾 。 这 个 值 在 应 用 层 可 以 通过 lseek 或 fseek 函数 来 调整 。 

文件 描述 符 的 取 值 范围 在 0 一 NR_OPEN 之 间 ,Linux 系统 中 NR. OPEN 默认 设置 
为 255 ,也 就 是 说 每 个 进程 最 多 只 能 打开 256 个 文件 。 

当 一 个 程序 开始 运行 时 ,编号 为 0、1、2 的 三 个 文件 描述 符 就 已 经 默认 打开 了 ,因此 用 
户 使 用 的 文件 描述 符 最 小 从 3 开始 。 文 件 描述 符 0 代表 标准 输入 文件 ,一 般 就 是 键盘 ; 文 
件 描述 符 1 代表 标准 输出 文件 ,一 般 指 显 示 器 ;文件 描述 符 2 代表 标准 错误 输出 ,一 般 也 
指 显示 器 。 事 实 上 ,在 代码 中 经 常 使 用 STDIN _FILENO, STDOUT_FILENO 和 
STDERR FILENO 来 代替 0、1 和 2。 
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Linux 中 包含 以 下 几 种 文件 类 型 。 

CD 普通 文件 (regular file) ; 这 是 常见 的 文件 类 型 ,这 种 文件 包含 了 某 种 形式 的 数 
据 , 至 于 这 种 数据 是 文本 还 是 二 进 制 数据 ,对 内 核 而 言 并 无 区 别 。 对 普通 文件 内 容 的 解释 
由 处 理 该 文件 的 应 用 程序 完成 。 

(2) 目录 文件 (directory file) ; 目录 文件 就 是 目录 ,目录 也 有 访问 权限 ,目录 文件 的 
内 容 就 是 该 目录 下 的 文件 和 子 目录 的 信息 ,对 一 个 目录 文件 具有 读 许可 权 的 任 一 进程 都 
可 以 读 该 目录 的 内 容 , 但 只 有 内 核 可 以 写 目 录 文 件 。 

(3) 字符 特殊 文件 (character special file): 用 于 表示 系统 字符 类 型 的 设备 ,比如 键 
盘 , 鼠 标 等 ,这 些 硬件 对 操作 系统 来 说 只 是 一 个 文件 。 

(4) 块 特殊 文件 (block special file): 用 于 表示 系统 中 块 类 型 的 设备 ,如 硬盘 、 光 了 驱 
等 。 对 这 些 设备 上 的 数据 的 访问 通常 以 块 的 方式 进行 , 即 一 次 至 少 读 写 一 块 。 

(5) FIFO: 这 种 类 型 文件 用 于 进程 间 的 通信 ,也 称 为 命名 管道 。 

(6) 套 接 字 (socket) : 主要 用 于 网 络 通信 , 套 接 字 也 可 以 用 于 一 台 主 机 上 的 进程 之 间 
的 通信 。 

(7) 符号 链接 (symbolic link) : 指向 另 一 个 文件 ,是 另 一 个 文件 的 引用 。 

在 Shell 下 可 通过 输入 ls -1 一 文件 名 二 来 查看 文件 的 类 型 ,在 程序 中 查看 文件 的 类 型 
则 需要 使 用 stat/fstat/Istat 函数 族 ,在 3.4. 1 节 将 会 介绍 。 例 如 ,在 某 个 目录 下 执行 ls -1 
的 结果 如 下 : 

root@ubuntu:~ # 1s -1 

-rw-r--r-- lro rot 71 1A 1 13:43test.c 

drwxr-xr-x 3 root root 4096 3 月 20 08:34 zll 
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结果 中 ,第 一 行 的 第 一 项 表示 “文件 的 类 型 和 访问 权限 ”, 第 一 个 字母 “-” 表 示 test. c 
是 一 个 普通 文件 。 第 二 行 的 第 一 个 字母 “d” 取 自 directory 的 首 字母 ,表示 zll 是 一 个 
目录 。 

执行 下 面 的 命令 ls -1/ ,结果 如 下 : 


root@ubuntu:~ # 1s -1/ 
lrwxrwxrwx 1 root root 33 10 Ẹ 28 2015 initrd.img - > boot/initrd.img- 3.19.0- 3l- generic 


结果 中 ,第 一 项 的 第 一 个 字母 “1” 表 示 initrd. img 文件 是 一 个 链接 文件 , 它 是 boot/ 
initrd. img-3. 19. 0-31-generic 文件 的 引用 。 
执行 下 面 的 命令 ls /dev/sda -1, 结 果 如 下 : 


root@ubuntu:/# ls /dev/sda - 1 
brw-rw---- lrootdisk8, 0 4 月 5 2017 /dev/sda 


第 一 项 的 第 一 个 字母 *b” 取 自 block 的 首 字母 ,表示 /dev/sda 文件 是 一 个 块 特殊 
交 性 。 
在 1s -1 二 文件 名 二 命令 结果 显示 中 ,文件 类 型 用 最 左边 一 栏 第 一 字母 表示 ,是 文件 类 
型 的 缩写 ,汇总 说 明 如 下 : 
* -(regular) ; 普通 文件 。 
d(directory): 目录 文件 。 
cCcharacter) : 字符 设备 文件 。 
b(block) : 块 设备 文件 。 
p(pipe) : 管道 文件 (命名 管道 ) 
s(socket) : 套 接 字 文件 。 
IClinko : 链接 文件 ( 软 链接 即 符号 链接 ) 。 
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2251 访问 权限 控制 

Linux 是 一 个 多 用 户 、 多 任务 的 操作 系统 ,因此 可 能 常常 会 有 多 个 用 户 同时 使 用 一 台 
主机 工作 。 为 了 保证 多 用 户 对 同一 主机 文件 系统 的 安全 访问 ,Linux 对 用 户 访问 文件 进 
行 了 访问 控制 。 比 如 ,文件 的 创建 者 不 希望 其 他 用 户 修改 自己 的 文件 ,管理 员 不 希望 普通 
用 户 有 运行 系统 中 某 些 命令 的 权利 。 在 Linux 中 ,当前 用 户 有 可 能 是 文件 的 所 有 者 .与 文 
件 所 有 者 同 在 一 组 或 是 其 他 用 户 ,根据 这 三 种 不 同 的 身份 ,系统 分 别 对 文件 的 读 、 写 .执行 
权限 进行 控制 ,从 而 保证 多 用 户 对 同一 主机 上 文件 访问 的 安全 性 。 

在 Shell 环境 中 ,可 以 通过 1s -1 一 filename 二 命令 来 查看 某 一 个 文件 的 属性 ,例如 以 
下 输出 是 在 某 个 目录 下 执行 ls -1 命令 的 结果 : 


-rw-r--r-- lrotro 7 1 月 111:43test.c 
drwxr-xr-x 3 rootroot 4096 3 月 20 08:34 z1l 


输出 结果 中 ,从 左 至 右 依次 是 : 文件 类 型 十 访问 权限 、 连 接 数 文件 所 有 者 、 拥 有 该 文 
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件 的 用 户 所 属 的 组 ,文件 大 小 ,文件 的 创建 时 间 文件 名 。 

第 一 项 “文件 类 型 十 访问 权限 ” 共 由 10 位 构成 ,第 一 位 表示 文件 类 型 。 剩 下 9 位 表示 
文件 的 访问 权限 。 按 照 每 3 位 为 一 组 分 为 3 组 ,从 左 到 右 : 第 一 组 表示 文件 所 有 者 对 该 
文件 的 操作 权限 ;第 二 组 表示 与 文件 所 有 者 同 组 (group) 的 用 户 对 该 文件 的 操作 权限 ;第 
三 组 表示 其 他 用 户 对 该 文件 的 操作 权限 。 通 常 每 组 会 出 现 3 种 字母 ,r 表示 具有 读 权限 ， 
w 表示 具有 写 权限 ,x 表示 具有 执行 权限 。 

以 test. c 文件 为 例 : 第 一 组 为 rw-, 表 示 test. c 的 所 有 者 具有 对 该 文件 的 读 写 权限 ， 
无 可 执行 权限 ;第 二 组 r 一 ,表示 test. c 文件 所 有 者 所 在 的 组 对 该 文件 具有 读 权限 ,无 写 、 
无 执行 的 权限 ;第 三 组 为 一 ,表示 其 他 用 户 对 该 文件 具有 读 权 限 ,无 写 ,无 执行 的 权限 。 

对 文件 访问 权限 的 修改 在 Shell 环境 中 可 通过 chmod 命令 来 实现 ,如 : 


root@ubuntu:~ # chmod 666 test.c 
rootGubuntu:- # ls - 1 
-rw-rw-rw- lrootroot 71 1A 1111:43 test.c 


chmod 命令 中 的 数字 6 是 通过 计算 所 得 ,对 于 可 读 、 可 写 、 可 执行 3 种 权限 ,分 别 对 应 
了 一 个 值 , 读 权限 为 4, 写 权限 为 2, 执 行 权 限 为 1, 即 r 二 4、w 二 2、x 二 1,4 十 2 二 6, 表 示 拥 有 
读 写 权限 但 不 具有 可 执行 权限 。666 表示 test. c 文件 的 访问 权限 修改 为 : 所 有 者 ,所属 组 
和 其 他 用 户 具有 读 、 写 ,不 可 执行 的 3 种 权限 ,更 详细 的 用 法 请 参考 man 手册 。 

通过 之 后 的 1s -1 命令 可 以 看 到 ,test.c 的 所 有 者 、 所 属 组 和 其 他 用 户 都 拥有 对 test. c 
的 读 、 写 .不 可 执行 3 种 权限 。 

在 进行 程序 设计 时 ,可 以 通过 chmod/fchmod 函数 对 文件 访问 权限 进行 修改 ,可 参考 
3.4.2455, 

S252 访问 权限 在 系统 中 的 表示 

1. st. mode 结构 

文件 类 型 与 访问 权限 被 定义 在 一 个 名 为 st mode 的 内 核 数据 结构 中 ,st_mode 实质 
上 是 一 个 无 符号 16 位 短 整 型 数 ,文件 类 型 和 权限 被 编码 在 这 个 数 中 ,如 图 3.6 所 示 。 


sticky 


suid sgid 
— 文 作 类 型 一 | | | | 权限 
| ve[zlslele|lx[e wheel x 
15 14 13 12 M 10 9 8 7 6 5 4 3 2 1 0 


图 3.6 st mode 内 核 数 据 结构 


其 中 低 9 位 即 st_mode[0:8] 一 一 对 应 代表 了 文件 的 各 种 用 户 权限 ,分 为 3 组 ,对 应 3 
种 用 户 , 它 们 是 文件 所 有 者 、 同 组 用 户 和 其 他 用 户 ， r 为 读 权限 ,w 为 写 权 限 ,x 为 执行 
权限 。 

其 中 高 4 位 即 st_mode[12:15] 用 作文 件 类 型 ,最 多 可 以 标识 16 种 类 型 ,目前 已 经 使 
用 了 其 中 7 个 。 
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接 下 来 的 3 位 st_mode[9:11] 即 是 文件 的 特殊 属性 ,1 代表 具有 某 种 属性 ,0 代表 没 
有 ,这 3 位 分 别 是 suid 位 ,sgid 位 和 sticky 位 。 

st_mode[10] 和 st_mode[11] 分 别 用 来 设置 文件 的 suid( 只 对 普通 文件 有 效 ) 和 sgid 
(只 对 目录 有 效 )。 如 果 suid 被 设置 为 1, 则 任何 用 户 在 执行 该 文件 时 均 会 获得 该 文件 所 
有 者 的 临时 授权 , 即 其 有 效 UID 将 等 于 文件 所 有 者 的 UID。 如 果 sgid 被 设置 为 1, 则 任 
何在 该 目录 下 执行 的 程序 均 会 获得 该 目录 所 属 组 成 员 的 临时 授权 , 即 其 有 效 GID 将 等 于 
该 目录 所 属 组 成 员 的 GID。 

suid 和 sgid 位 能 让 普通 用 户 以 root 用户 的 角色 运行 只 有 root 账号 才能 运行 的 程序 
或 命令 ,另外 ,这 种 机 制 对 于 某 些 只 能 由 root 用 户 启动 ,但 启动 后 需要 回 到 普通 用 户 权限 
的 程序 很 有 帮助 。 

例如 ,普通 用 户 运 行 passwd 命令 可 以 更 改 个 人 的 账号 密码 ,用 户 账号 密码 存放 在 
/etc/ passwd 文件 中 ,因此 修改 用 户 密码 实际 上 最 终 更 改 的 是 /etc/passwd 文件 。 通 过 1s 
-l /etc/passwd 命令 可 以 查看 /etc/passwd 文件 的 属性 。 如 下 所 示 : 

rooteubuntusetc# 1s - 1 /etc/passwd 

-rw-r--r-- 1root root 1920 4 月 5 2017/etc/passwi 

运行 结果 显示 ,只 有 具有 root 权限 的 用 户 才能 更 改 /ect/passwd 文件 的 内 容 。 

那么 普通 用 户 是 如 何 通过 passwd 命令 修改 个 人 的 账号 密码 呢 ? 通过 1s -1 /usr/bin/ 
passwd 命令 可 以 查看 到 passwd 命令 程序 的 文件 属性 ,如 下 所 示 : 

root@ubuntu:~ # ls - 1 /usr/bin/passwd 

- rwsr- xr- x 1 root root 47032 7 月 16 2015 /usr/bin/passwd 

标志 s 出 现在 文件 所 有 者 执行 权限 位 上 ,说 明文 件 /usr/bin/passwd 文件 的 suid 位 
为 1, 意 味 着 执行 passwd 命令 的 用 户 暂 时 具有 该 程序 所 有 者 (root) 的 权限 ,因此 普通 用 户 
可 以 执行 passwd 命令 修改 个 人 账号 密码 。 

标志 s 出 现在 文件 所 有 者 的 执行 权限 位 上 ,说 明 id 位 置 1; 标 志 s 出 现在 用 户 组 的 执 
行 权限 位 上 ,说 明 sgid 位 为 1, 如 -rwx--s 一 x; 标 志 在 其 他 组 的 x 位 上 ,说 明 sticky Tt 1, 如 
-rwxr---t。sticky( 只 对 目录 有 效 ) 在 当前 用 户 拥有 该 目录 的 写 权 限 情况 下 ,如 果 这 一 位 
被 设置 1, 那 么 该 用 户 只 能 删除 在 本 目录 下 属于 自己 的 文件 。 

suid、sgid 和 sticky 权限 设置 ,可 以 通过 chmod 命令 来 实现 ,在 3. 2. 5. 1 节 中 已 经 了 
fit chmod 可 以 通过 数字 形态 更 改 权限 ,那么 在 表示 读 、 写 .执行 权限 的 三 个 数字 之 前 所 加 
的 那个 数 就 代表 了 这 三 个 特殊 权限 ,其 中 suid 为 4,sgid 为 2.sticky 为 1。 如 下 所 示 : 

rootGubuntu: # chmod 7666 test.c 

rootG$ubuntu:- $ 1s -1 test.c 

-rwSrwSrW,lroot root 71 1 月 11 11:43 test.c 

一 rwSrwSrwT 表 示 test.c 文 件 权限 suid, sgid, sticky f RE 1 

2. EBRR 

通过 按 位 与 操作 , 掩 码 可 以 将 二 进 制 数 中 不 需要 的 位 置 0, 需 要 的 位 的 值 不 发 生 改 
变 。 图 3.7 是 为 八进制 数 042664 的 st_mode 值 按 位 与 八进制 掩 码 170000 的 计算 过 程 ， 
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可 以 看 到 ,结果 中 保留 了 042664 高 4 位 的 值 , 将 低 12 位 值 置 为 0。 


0|1/0/0|0]|1|0]|1]|1]|0 | 时 | 0 | 0 st mode(042664) 
1|1[/1[1/[0[0/[|0/0/|0]|0 | 0|0|0|0 | 0 | 0 HENI (170000) 
0|1|10|10|101010101010 | 0|/0[|0/|0 | 0|0 


3.7 ” 掩 码 技术 运算 示例 


通过 图 3.7 可 以 看 出 ,042664 与 170000 经 过 位 与 运算 后 ,得 到 八进制 040000 ,说 明 
st_mode 值 对 应 的 文件 是 一 个 目录 文件 。 

3. st_mode 中 一 些 宏 定义 

为 了 对 文件 的 st_mode 值 操作 方便 ,Linux 系统 在 /usr/include/sys/stat. h 文件 中 定 
义 了 一 些 宏 , 这 些 宏 中 包括 了 文件 类 型 和 权限 掩 码 的 定义 和 应 用 。 

下 面 是 关于 文件 类 型 和 特殊 位 的 宏 定 义 : 


#define S IEMP 00170000 /文件 类 型 掩 码 

# define S IFSOCK 0140000 // 文 件 类 型 : ERF 

# define S IFINK 0120000 /文件 类 型 : 链接 

#define S IFREG 0100000 /文件 类 型 : 普通 文件 

#define S IFBIK 0060000 /文件 类 型 : 块 设备 

#define S IFDIR 0040000 /文件 类 型 :目录 

#define S IFCHR 0020000 /文件 类 型 : 字符 设备 

#define S IFIFO 0010000 /文件 类 型 : 管道 

#define S ISUID 0004000 /文件 的 soia 

#dfine S ISGID 0002000 /文件 的 sgid 

#define S ISVIX 0001000 /文件 的 粘贴 位 

下 面 是 判断 文件 权限 的 宏 定义 : 

# define S ISINK(m) ((&) &S IMT) --S IFINK)  — // 判 断 是 否 为 链接 文件 

# define S ISREG(m) ((&) & S_IFMT) ==S_IFREG)  — // 判 断 是 否 为 普通 文件 
# define S_ISDIR ((&) &S IM) ==S_IFDIR) —— // 判 断 是 否 为 目录 文件 
# define S ISCHR(m) ((&) &S IM) ==S_IFCHR) /判断 是 否 为 字符 设备 文件 
# define S ISBIK(m) ((& &s IMT) -—s IFEIK) ”// 浏 断 是 否 为 块 设备 文件 
#define S ISFIFO(]  (((m) &s IMT) --s rrr) ”// 判 断 是 否 为 管道 文件 
#define S ISSXK(m  (((m) &S IM) --s FSK) ”// 判 断 是 否 为 套 接 字 文 件 
下 面 是 文件 权限 的 宏 定 义 : 

#define S IHWXU 00700 // 所 有 者 权限 掩 码 

# define S IRUSR 00400 // 所 有 者 读 权限 

# define S IWUSR 00200 // 所 有 者 写 权 限 


# define S IXUSR 00100 


// 所 有 者 执行 权限 


)/ 


# define S IXSRP 00010 
# define S IRWXO 00007 
fdefine S IFOTH 00004 
# define S IWOTH 00002 
# define S IOTH 00001 


// 所 属 组 成 员 权限 掩 码 
// 所 属 组 成 员 读 权限 
// 所 属 组 成 员 写 权限 
// 所 属 组 成 员 执行 权限 
// 其 他 用 户 权限 掩 码 
/| 其 他 用 户 读 权限 

/| 其 他 用 户 写 权限 

/| 其 他 用 户 执行 权限 


3.3 文件 的 读 写 


在 Linux 操作 系统 中 ,提供 了 对 文件 L/O 操作 的 两 类 接口 ,分 别 是 L/O 系统 调用 接 
口 和 标准 I/O 库 函 数 接口 ,它们 的 关系 如 图 3. 8 所 示 。 直 接 1/0 系统 调用 ,遵守 POSIX 
标准 ,是 Linux 操作 系统 自身 提供 的 系统 调用 卫 数 ,如 open、read、write 和 close 等 函数 ， 
这 些 函 数 的 使 用 方法 可 以 在 Shell 下 输入 “man 2 二 函 数 名 二 ”命令 获取 。 直 接 进行 IO 
系统 调用 的 可 移植 性 差 , 只 能 在 遵循 POSIX 标准 的 类 UNIX 环境 中 直接 使 用 。 标 准 W/O 
ERGE ANSI 标准 提供 的 标准 1/0 库 函 数 ,如 fopen, fread, fwrite 和 fclose 等 函数 ， 
这 些 函 数 的 使 用 方法 可 以 在 Shell 下 输入 “man 3 二 函数 名 二 ”命令 获取 ,这 些 库 函数 是 对 
直接 1/0 系统 调用 的 封装 ,其 在 访问 文件 时 根据 需要 设置 了 不 同类 型 的 缓冲 区 ,从 而 减 
少 直接 I/O 系统 调用 的 次 数 ,提高 访问 效率 。 但 这 需要 系统 下 有 相应 的 库 支持 ,另外 ,对 
于 特殊 操作 只 能 使 用 直接 1/0 操作 。 


APP 


fopen() fseek() 
fread() — fclose() 
fwrite) |... 


IS 标准 IO C 库 接口 
open() lseek() 
read() close() i 
WriteO ...... i 
POSIX 接 吕 |-— 系统 调用 接口 
OS 


图 3.8 1/0 系统 调用 和 标准 I/O 库 函 数 关 系 


无 论 是 直接 1/O 系统 调用 (POSIX 接口 ,系统 IO) 还 是 标准 L/O E PR CCANSI 接 
口 ,标准 1/0) ,都 是 为 应 用 程序 服务 的 L/O 接口 ,只 是 工作 在 不 同 的 层次 ,用 户 可 以 根据 
实际 需要 调用 相应 的 接口 完成 应 用 的 需求 。 
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331 文件 打开 、 创 建 和 关闭 


1. open 系统 调用 

对 某 一 个 文件 进行 操作 之 前 .首先 必须 “打开 ” 它 ,系统 调用 open 用 来 打开 或 创建 一 
个 文件 ,并 返回 一 个 文件 描述 符 ,其 他 的 函数 可 以 通过 文件 描述 符 指 定 文件 进行 读 取 与 写 
和信 操作。 在 Shell 下 输入 “man 2 open” 可 以 获取 该 函数 的 原型 。open 系统 调用 接口 规范 
说 明 如 表 3. 2 所 示 。 


表 3.2 open 函数 的 接口 规范 说 明 


函数 名 称 open 
函数 功能 打开 或 创建 文件 

# include —sys/types. h> 
头 文件 # include — sys/stat. h> 


# include <fcntl. h> 


int open(const char * pathname, int flags) ; 
函数 原型 : i 


int open(const char * pathname, int flags, mode t mode) ; 


pathname: 要 打开 或 创建 的 含 路 径 的 文件 名 
参数 flags: 文件 状态 标志 ,表示 打开 文件 的 方式 
mode: 如 果 文件 被 新 建 ,指定 其 权限 为 mode( 八 进 制 表示 法 ) 


大 于 或 等 于 0 的 整数 : 成 功 ( 即 文件 描述 符 ) 
一 1: 失败 


返回 值 


说 明 : 
对 open 函数 而 言 , 仅 当 创建 新 文件 时 才 使 用 mode 参数 。 
flags 参数 可 以 用 来 说 明 open 函数 的 多 个 选择 ,参数 值 可 分 为 两 类 ,一 类 是 主 标志 ， 
一 类 是 副 标 志 。 用 下 列 一 个 或 多 个 标志 常量 进行 “或 ”运算 构成 flags 参数 (这 些 常量 在 头 
文件 二 fcntl. h 之 中 定义 ) 。 下 面 对 这 两 类 标志 常量 做 详细 的 介绍 。 
CO 主 标志 如 下 : 
* O_RDONLY: 以 只 读 方式 打开 文件 。 
* O WRONLY: 以 只 写 方式 打开 文件 。 
* O_RDWR: 以 可 读 可 写 方式 打开 文件 。 
主 标志 是 互 斥 的 ,使 用 其 中 一 种 则 不 能 再 使 用 另外 一 种 。 除 了 主 标志 以 外 ,还 有 副 标 
志 可 与 它们 配合 使 用 , 副 标 志 可 同时 使 用 多 个 ,使 用 时 在 主 标志 和 副 标 志 之 间 加 入 按 位 与 
(|) 运 算 符 。 
(2) 副 标 志 如 下 : 
* O_CREAT: 如 果 文 件 不 存在 , 则 创建 该 文件 ,只 有 在 此 时 , 才 需 要 用 到 第 三 
数 mode, 以 说 明 新 文件 的 存 取 权 限 。 
* O EXCL: 如 果 O CREAT 也 被 设置 ,此 指令 会 去 检查 文件 是 否 存在 。 文 件 若 不 
存在 则 创建 该 文件 , 若 文件 已 存在 将 导致 打开 文件 出 错 。 
。O_TRUNC: 若 文件 存在 并 且 以 写 的 方式 打开 时 ,此 标志 将 文件 长 度 清 为 0, 即 源 
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文件 中 保存 的 数据 丢失 ,但 文件 属性 不 变 。 
O APPEND: 所 写 入 的 数据 以 追加 的 方式 加 入 到 文件 后 面 。 
O_NOCTTY: 如 果 文 件 为 终端 ,那么 终端 不 可 以 作为 调用 open() 系 统 调用 的 那 
个 进程 的 控制 终端 。 
O_CLOEXEC: 把 FD_CLOEXEC 常量 设置 为 文件 描述 符 标志 。 
O_DIRECTORY: 如 果 pathname 引用 的 不 是 目录 , 则 出 错 。 
O_NOFLLOW: 如 果 pathname 引用 的 是 一 个 符号 链接 , 则 出 错 。 
O NONBLOCK: 如 果 pathname 引用 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 一 个 字符 
特殊 文件 , 则 此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 1/O 操作 设置 非 阻塞 方式 。 
新 建文 件 操作 可 以 在 open 函数 中 加 入 O_CREAT 副 标 志 实 现 ,创建 新 文件 时 还 可 
以 通过 参数 mode 设置 文件 的 权限 。 参 数 mode 含义 与 3.2.5 节 中 的 st mode 相同 。 
系统 调用 open 可 以 用 来 打开 普通 文件 , 块 设备 文件 .字符 设备 文件 .链接 文件 和 管道 
文件 ,但 只 能 用 来 创建 普通 文件 ,创建 特殊 文件 需要 使 用 特定 的 函数 。 
成 功 调用 open 后 会 返回 一 个 文件 描述 符 ,车 有 错误 发 生 则 返回 一 1, 并 把 错误 代码 赋 
给 errno。 详 细 的 错误 代码 说 明 可 以 参考 man 手册 。 
2. creat 系统 调用 
创建 文件 还 可 以 通过 系统 调用 creat 来 完成 。creat 的 接口 规范 说 明 如 表 3. 3 所 示 。 


表 3.3 creat 函数 的 接口 规范 说 明 


函数 名 称 creat 
函数 功能 打开 或 创建 文件 

# include —sys/types. h> 
头 文件 # include <sys/stat. h> 


# include —fentl. h> 


函数 原型 int creat(const char * pathname, mode_t mode); 


pathname: 要 打开 或 创建 的 含 路 径 的 文件 名 


参数 mode: 设置 新 文件 的 权限 
S EINeT 0 的 整数 , 成 功 ( 即 文件 描述 符 ) 
说 明 


creat 只 能 以 只 写 的 方式 打开 创建 的 文件 ,creat 无 法 创建 设备 文件 ,设备 文件 的 创建 
要 使 用 mknod 函数 。 

creat 也 数 的 第 一 个 参数 pathname 是 要 打开 或 创建 的 文件 名 ,如 果 pathname 指向 的 文 
件 不 存在 , 则 创建 一 个 新 文件 ;如 果 pathname 指向 的 文件 存在 , 则 原文 件 将 被 新 文件 覆盖 。 

第 二 个 参数 mode 与 open 函数 含义 相同 。creat 相当 于 这 样 使 用 open: 


int cpen (const char * pathname, (O CREAE|O WRONLY|O TRUNC)); 


成 功 调用 creat 后 会 返回 一 个 文件 描述 符 , 若 有 错误 发 生 则 会 返回 一 1, 并 把 错误 代 
码 赋 给 errno, 
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3. close 系统 调用 

系统 调用 close 用 来 关闭 一 个 已 经 打开 的 文件 。 在 对 文件 操作 完成 之 后 ,不 再 使 用 
时 ,需要 通过 close 函数 关闭 已 经 打开 的 文件 并 释放 相应 的 资源 ,防止 内 核 为 继续 维护 它 
而 付出 不 必要 的 代价 。close 系统 调用 接口 规范 说 明 如 表 3.4 所 示 。 


表 3.4 close 函数 的 接口 规范 说 明 


函数 名 称 close 

函数 功能 打开 或 创建 文件 

头 文件 # include —unistd. h> 

函数 原型 int closeCint fd); 

参数 fd: 即将 要 关闭 的 文件 描述 符 
ini up 


在 示例 程序 3. 1 中 ,示范 了 如 何 使 用 open creat close 函数 。 


[示例 程序 3.1 cpen creat.c] 
# includec sys/stat..h» 

# include< fcntl.h» 

# include< unistd.h> 

# include< errno.h» 

# includec string.h» 


int main() 
t 
int fd; 
if ((fd= open ("test3 1.c",O CREAT|O EXCL,S IRUSR|S IWUSR))-—- 1) 
f 
//i£ ((£d- creat ("test3_1.c",S_IRWXU))==- 1{ 
perror ("open () error."); 
//printf ("open:$s with errno:$d Wn", strerror (error) ,errno) ; 
exit(1); 
) 
else 
t 
printf ("create file sucoess\n"); 
) 
close(fd); 
return 0; 
} 


示例 程序 3. 1 使 用 open 系统 调用 在 当前 目录 下 创建 一 个 名 为 test3_1. c 的 文件 , 且 
新 文件 的 存 取 权限 为 所 有 者 可 读 可 写 , 随 后 关闭 该 文件 。 执 行 结果 如 下 : 
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root@ubuntu:~ # -/apen creat 

fd: 3 

create file success 

rootQubuntu:- # ls - 1 open creat.c 

-rw-r--r--1root root 388 3 月 27 15:47 cpen creat.c 


从 运行 结果 中 可 以 看 到 ,第 一 次 执行 该 程序 成 功 地 创建 了 文件 test3. 1. c, 且 该 文件 
的 访问 权限 也 符合 预期 ,使 用 open 函数 打开 文件 test3_1.c 返回 的 文件 描述 符 是 3 ,那么 
再 次 执行 该 程序 结果 又 会 是 怎样 呢 ? 再 次 运行 程序 ,结果 如 下 : 

root@ubuntu:~ # ./apen creat 

cpen () error.: File exists 

这 是 因为 在 调用 open 时 ,同时 设置 了 O CREAT fil O EXCL 标志 , 则 当 文件 存在 
时 ,open 调用 失败 ,系统 将 错误 代码 设置 成 EEXIST ,表示 文件 已 经 存在 。 

把 “perror("open() error.");” 这 一 行 代码 注释 掉 , 取 消 下 一 行 的 注释 ,重新 编译 并 
运行 程序 ,可 以 得 到 如 下 结果 : 

root@ubuntu:~# ./cpen creat 

cpen:File exists with errno:17 

如 果 要 从 错误 代码 获取 相应 的 错误 描述 ,可 以 使 用 这 种 办 法 ,使 用 时 注意 包含 头 文件 
errno. h, 

将 程序 中 调用 open 函数 的 代码 注释 掉 , 取 消 调用 creat 函数 的 注释 ,第 二 次 执行 该 程 
序 就 不 会 报错 了 ,因为 对 于 creat 而 言 ,将 会 覆盖 已 存在 的 文件 。 

注意 : 重复 关闭 一 个 已 经 关闭 了 的 文件 或 尚未 打开 的 文件 是 安全 的 。 
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1. read 系统 调用 
read 系统 调用 用 来 从 打开 的 文件 中 读 取 数据 ,其 接口 规范 说 明 如 表 3. 5 所 示 。 


表 3.5 read 函数 的 接口 规范 说 明 


函数 名 称 read 

函数 功能 从 指定 文件 中 读 取 数 据 

头 文件 # include —unistd. h> 

函数 原型 ssize t read(int fd, void * buf, size t count); 


fd. 从 文件 fd 读数 据 
参数 buf: 指向 存放 读 到 的 数据 的 缓冲 区 
count; 从 文件 fd 中 读 取 的 字 节 数 


实际 读 到 的 字 节 数 : 成 功 (实际 读 到 的 字 节 数 小 于 或 等 于 count) 
失败 : 一 1 


返回 值 
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说 明 : 

read 函数 从 文件 描述 符 fd 所 指向 的 文件 中 读 取 count 个 字 节 的 数据 到 buf 所 指向 
的 缓冲 区 中 。 车 参数 count 为 0 时 , 则 read 函数 不 会 读 取 数 据 ,只 返回 0。 返回 值 表示 实 
际 读 取 到 的 字 节 数 , 如 果 返 回 为 0, 表 示 已 到 达 文 件 尾 或 是 无 可 读 取 的 数据 ,此 外 文件 读 
写 指 针 会 随 读 取 到 的 字 节 移动 。 如 果 read 函数 顺利 返回 实际 读 到 的 字 节 数 ,最 好 能 将 返 
回 值 与 count 作 比 较 , 若 返回 的 字 节 数 比 要 求 读 取 的 字 节 数 少 , 则 有 可 能 读 到 了 文件 末尾 
或 者 read 函数 被 信号 中 断 了 读 取 过 程 ,或 是 其 他 原因 。 

当 有 错误 发 生 时 返回 一 1, 错 误 代 码 存 人 errno 变量 中 ,详细 错误 代码 说 明 请 参考 
man 手册 。 

2. write 系统 调用 

write 系统 调用 用 来 将 数据 写 人 已 打开 的 文件 中 ,其 接口 规范 说 明 如 表 3. 6 所 示 。 


表 3.6 write 函数 的 接口 规范 说 明 


函数 名 称 write 

函数 功能 将 数据 写 人 指定 的 文件 

头 文件 # include —unistd. h> 

函数 原型 ssize t write(int fd, void * buf, size t count); 
fd: 将 数据 写 人 文件 fd 中 

参数 buf: 指向 要 写 人 fd 的 数据 所 在 的 缓冲 区 
count: 写 人 的 字 节 数 

3 实际 写 和 人 的 字 节 数 : 成 功 

Sat 一 1: 失败 


说 明 : 

write 函数 将 buf 所 指向 的 缓冲 区 中 的 count 个 字 节 数据 写 入 到 由 文件 描述 符 fd 所 
指示 的 文件 中 。 当 然 ,文件 读 写 指针 也 会 随 之 移动 。 如 果 调 用 成 功 ,write 函数 会 返回 写 
人 的 字 节 数 。 当 有 错误 发 生 时 则 返回 一 1 ,错误 代码 存 和 人 errno 中 。 详 细 的 错误 代码 说 明 
请 参考 man 手册 。 

注意 : 

* read 函数 和 write 函数 实际 读 / 写 字 节 数 要 通过 返回 值 来 判断 ,参数 count 只 是 一 
个 “愿望 值 ”。 
读 / 写 操作 都 会 对 内 核 中 表示 文件 偏 移 位 置 的 {_pos 起 作用 ,文件 的 位 置 偏 移 量 
都 会 加 上 实际 读 写 的 字 节 数 ,不 断 地 往 后 偏 移 。 

3. fentl 系统 调用 

fcntl 系统 调用 可 以 用 来 对 已 打开 的 文件 描述 符 进 行 各 种 控制 操作 以 改变 已 打开 文 
件 的 各 种 属性 ,例如 ,可 以 重新 设置 文件 的 读 、 写 .追加 、 非 阻塞 等 标志 。fcntl 系统 调用 接 
口 规范 说 明 如 表 3.7 所 示 。 

说 明 : 

fentl 的 功能 依据 cmd 值 的 不 同 而 不 同 ,cmd 具体 有 以 下 几 种 功能 。 
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(D F_DUPFD: 表示 复制 由 fd 指向 的 文件 描述 符 。 调 用 成 功 返 回 新 的 文件 描述 符 ， 
失败 返回 一 1, 错 误 代 码 存 人 errno 中 。 


表 3.7 fenti 函数 的 接口 规范 说 明 


函数 名 称 fcntl 
函数 功能 文件 控制 
头 文件 # include —unistd. h> 


# include —fentl. h> 


int fentlCint fd, int cmd); 
函数 原型 int fentlCint fd, int cmd, long arg); 
int fentlCint fd, int cmd, struct flock * lock); 


fd: 要 控制 的 文件 的 描述 符 
参数 cmd: 控制 命令 字 
变 参 : 根据 不 同 的 命令 字 而 不 同 


根据 不 同 的 cmd, 返 回 值 不 同 : 成 功 
一 1: 失败 


返回 值 


(2) F DUPFD CLOEXEC: 作用 和 F DUPFD 一 样 , 但 新 复制 的 描述 符 的 FD_ 
CLOEXEC 状态 会 被 设置 为 1。 

(3) F_GETFD: fcntl 用 来 获取 文件 描述 符 的 close-on-exec 标志 。 调 用 成 功 返回 标 
志 值 , 若 此 标志 值 的 最 后 一 位 是 0, 则 该 标志 没有 设置 , 即 意味 着 在 执行 exec 相关 函数 后 
文件 描述 符 仍 保持 打开 ;否则 在 执行 exec 相关 函数 时 将 关闭 该 文件 描述 符 ; 调 用 失败 返 
A= 

(4) F. SETFD: fcntl 用 来 将 文件 描述 符 的 close-on-exec 标志 设置 为 第 三 个 参数 arg 
的 最 后 一 位 。 成 功 返 回 0, 失 败 返回 一 1。 

(5) F_GETFL: fcntl 用 来 获得 文件 打开 的 方式 , 即 获取 文件 状态 标志 flags。 成 功 返 
回 标志 值 ,失败 返回 一 1。 标 志 值 的 含义 同 open 系统 调用 一 致 。 

(6) F_SETFL: fcntl 用 来 将 文件 打开 的 方式 flags 设置 为 第 三 个 参数 arg 指定 的 方 
式 。 在 Linux 系统 只 能 选择 将 flags 设置 为 0_ APPEND,O NONBLOCK 3X O_ASYNC, È 
们 的 含义 同 open 系统 调用 一 致 。 

下 面 通过 示例 语句 来 说 明 fentl 的 基本 用 法 。 


flags= fcntl (fd,F GETEL,O); // 获 取 文 件 的 flags 
fontl(fd,F SETFL, flags); // 设 置 文件 的 flags 
// 将 文件 设置 为 非 阻塞 状态 


flags= fcntl(fd,F GETEL,O); 
flags|-O NONBLIOCK; 
fentl(fd,F SETFL,flags); 


/将 文件 设置 为 阻塞 状态 
flags= fcntl(fd,F GETEL,O); 


flags= ~ O NONBLOCK; 


$38 ”文件 及 目录 管理 e^ 
fentl(fd,F SETEL, flags); 


示例 程序 3. 2 使 用 fcntl 函数 设置 和 获取 文件 打开 方式 文件 状态 标志 flags. 


[示例 程序 3.2 fcntl demo.c] 
# include stdio.h> 

# includec unistd.h> 

# include font1.h> 

# include< sys/types.h> 

# include< sys/stat.h> 


void my err(const char * err string,int line) 
t 
fprintf (stderr, "line: $d",line); 
perror(err string); 
exit(); 


int main() 

{ 
int ret; 
int access mode; 
int fd; 


if((fd-open("hello.c",O CEEAT|O TRUNC|O RUWR,S IRWXU))- —- 1) 
i 
my err("open", LINE ); 
i 
if((ret- fcntl(fd,F SETEL,O APFEND))« 0) 
t 
my err("fcntl", LINE ); 
) 
if((ret- fcntl(fd,F GETEL,O))« 0) 
t 
my err("fcnt]", LINE ); 
} 
access mode- ret&O AOMOLE; 


if(access mode==0 RDONLY) 
t 
printf ("hello.c access mode: read only"); 
j 
if (access mode-—O WEONLY) 
t 
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printf (hello.c access mode: write only"); 


} 


if (access mode==0 RIWR) 


t 


printf ("hello.c access mode: read write"); 


i 


if (ret & O APPEND) 


1 


printf (", append") ; 


} 


if (ret & O NONBLOCK) 


{ 


printf (", nonblock") ; 


I 
printf ("\n"); 
retum 0; 

} 


编译 该 程序 并 运行 ,得 到 结果 如 下 : 


root@ubuntu:~ # ./fcntl demo 

hello.c access mode: read + write,append 

使 用 fcntl 函数 还 可 以 给 文件 上 锁 。 由 于 Linux 是 多 用 户 操作 系统 ,存在 多 个 用 户 共 
同 使 用 和 操作 同一 个 文件 的 需求 ,这 时 需要 给 这 个 共享 文件 上 锁 , 以 避免 共享 的 资源 产生 


竞争 ,导致 数据 读 写 错误 。 


在 Linux 系统 中 ,给 文件 上 锁 可 以 使 用 记录 锁 。 记 录 锁 可 分 为 建议 性 锁 和 强制 性 锁 ， 
flock 系统 调用 可 以 给 文件 加 建议 性 锁 ,fcntl 系统 调用 可 以 给 文件 加 强制 性 锁 。 

当 一 个 文件 被 加 上 强制 性 锁 后 ,内核 将 阻止 多 于 1 个 以 上 的 进程 对 共享 文件 进行 读 
写 操作 ,从 而 保证 多 个 用 户 对 共享 文件 操作 的 互 斥 性 。 

当 fcntl 系统 调用 用 于 管理 文件 记录 锁 的 操作 时 ,第 三 个 参数 指向 一 个 struct flock 
* lock 的 结构 ,flock 结构 体 定义 如 下 所 示 : 


struct flock 

t 
short 1 type; 
short l whence; 
off t 1 start; 
off t 1 len; 
pid t 1 pid; 

B 


/* 锁 类 型 ,有 F ROCKE WELCK I F UNLCK 类 型 * / 

/* 偏 移 量 的 起 始 位 置 : SEEK SET, SEEK CUR, or SEEK END* / 
/* 相对 于 1 whence 的 偏 移 值 ,单位 为 字 节 * / 

/* 长 度 , 单位 为 字 节 ; 0 意味 着 缩 到 文件 结尾 * / 

/* 锁 的 属 主 进程 * / 


1 type 用 来 指定 锁 类 型 ,F_RDLCK 为 共享 锁 , 又 称 为 读 锁 ,意味 着 允许 多 个 进程 不 
需要 互 斥 地 读 文 件 ;而 F_WRLCK 为 互 斥 锁 ,又 称 为 写 锁 ,意味 着 多 个 进程 对 同一 文件 写 
操作 时 需要 互 斥 ;F_UNLCK 为 解锁 ,加 锁 后 必须 解锁 。 
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锁 的 设置 对 多 个 进程 是 不 兼容 的 , 即 多 个 进程 对 同一 文件 设置 加 锁 操 作 时 ,如 果 在 一 
个 字 节 上 已 经 有 一 把 互 斥 性 锁 , 则 不 能 再 对 它 加 任何 的 读 锁 。 并 且 对 于 一 个 进程 而 言 ,如 
果 某 一 文件 区 域 已 经 存在 文件 记录 锁 了 ,此 时 再 设置 新 锁 在 该 区 域 的 话 , 旧 锁 将 会 被 新 锁 
取代 。 一 个 进程 只 能 设置 某 一 文件 区 域 上 的 一 种 锁 。 

] whence,l start & 1 len 共同 来 确定 需要 进程 文件 记录 锁 操 作 的 区 域 。1_whence 
可 取 值 为 SEEK_SET、SEEK_CUR 和 SEEK_END, 分 别 代表 文件 开始 位 置 .文件 当前 位 
置 .文件 末尾 位 置 。L_start 表示 锁 区 域 相对 于 L_whence 的 偏 移 量 , 可 以 是 负数 。1_len 是 
锁 区 域 的 长 度 。 如 果 llen 为 0, 则 表示 锁 的 区 域 从 其 起 点 (由 1_start 和 1_whence 决定 ) 
开始 直至 最 大 的 可 能 位 置 为 止 都 处 于 锁 的 范围 。 通 常 将 D start 设置 为 0;1_whence 设置 
为 SEEK SET;l len 设置 为 0, 表示 锁 整 个 文件 。 

(7) F_SETLK: 根据 1 type 的 值 ,设置 锁 和 释放 锁 。1_type 为 F_RDLCK 时 表示 为 
共享 锁 ,L_type 为 F_WRLCK 时 表示 为 互 斥 锁 ,L_type 为 F_UNLCK 表示 为 解锁 。 如 果 
锁 被 其 他 进程 占用 , 则 返回 一 1 并 设置 errno 为 EACCESS 或 EAGAIN。 

当 锁 设置 为 共享 锁 时 ,fd 所 指向 的 文件 必须 以 只 读 方 式 打开 ; 当 锁 设置 为 互 斥 锁 时 ， 
fd 所 指向 的 文件 必须 以 可 写 方式 打开 。 当 设置 共享 和 互 斥 两 种 锁 时 ,fd 所 指向 的 文件 必 
须 以 可 读 写 方式 打开 。 当 进程 结束 或 文件 被 close 系统 调用 时 , 锁 自 动 释放 。 

(8 F_GETLK: 判断 由 第 三 个 参数 lock 所 描述 的 锁 是 否 会 被 另 一 把 锁 排 斥 。 如 果 
存在 一 把 锁 , 它 阻止 创建 由 lock 所 描述 的 锁 , 则 现 有 锁 的 信息 将 重 写 lock 指向 的 信息 。 
如 果 不 存在 这 种 情况 , 则 除了 将 L_type 设置 为 F_UNLCK 之 外 ,lock 所 指向 结构 中 的 其 
他 信息 保持 不 变 。 

cmd 取 (7) 和 (8) 时 ,执行 成 功 返 回 0, 当 有 错误 发 生 时 返回 一 1, 错 误 代 码 存 人 errno 
中 ,详细 的 错误 代码 说 明 参 考 man 手册 。 

下 面 通过 示例 程序 3. 3 演示 如 何 使 用 fcntl 系统 调用 来 实现 对 共享 文件 上 锁 和 解锁 。 

[示例 程序 3.3 fcntl lock demo.c] 

# include< stdio.h> 

# include< unistd.h» 

# include fcnt1.h> 

# include< sys/types.h> 

# include< sys/stat.h> 

# includec string.h> 


void lock set(int fd, int type) 
f 
struct flock lock; 
lock.l whenoe- SEEK SET; 
lock.l start-0; 
lock.l len-0; 


while(1) 
t 
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证 (fcntl (fd,F SETIK, &lock)-— 0) 
{ 
if(lock.l type==F RDICK) 
printf(" 加 上 读 取 锁 的 是 : sd 进程 \n"vgetpid(0); 
else if(lock.l type==F WICK) 
Printf(" 加 上 写 人 锁 的 是 : $d 进程 \n",getpid()); 
else if(lock.l type==F UNICK) 
Printf(" 释 放 强 制 性 锁 的 是 : $d 进程 \n",getpid()); 
retum ; 


perror ("Bi Pe FE A WC Nn ; 
//return ; 


if(fcntl(fd,F GETIK, &lock)- — 0) 
t 
if(ock.l type !-F UNICK) 
t 
ifüock.l type-- F RICK) 
Printf(" 文 件 已 经 加 上 了 读 取 锁 ,其 进程 号 是 : saw" lock.l pid); 
else if(lock.1 type-- F WEICK) 
printf(" 文 件 已 经 加 上 了 写 入 锁 , 其 进程 号 是 : Santi lock.l pid); 
getchar(); 


perror ("WRA 13e BUR e \n"); 


retum ; 


int main() 
t 
int fd; 
fd-cpen("hello lck.c",O RUWR|O CRERT ,0666); 
if(fdc 0) 
t 
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Perror( 呆 开 出 错 "); 


exit (1); 


lock set (fd,F WRICK); 
getchar(); 

lock set(fd,F UNICK); 
getchar(); 

lock _set (fd,F ROCK); 
getchar(); 

lock set(fd,F UNICK); 
close(fd); 

exit (0); 

} 


将 示例 程序 3. 3 编译 后 运行 ,输出 结果 如 下 : 

root@ubuntu:~ # ./fcntl lock demo 

加 上 写 人 锁 的 是 : 5769 ERE 

释放 强制 性 锁 的 是 : 5788 进 程 

加 上 读 取 锁 的 是 : 5788 进 程 

释放 强制 性 锁 的 是 : 5788 进 程 

从 上 面 的 运行 结果 来 看 ,示例 程序 对 编号 为 5788 的 进程 进行 了 设置 写 锁 、 释 放 写 锁 、 
设置 读 锁 和 释放 写 锁 的 操作 。 进 程 fentl lock. demo 通过 fcntl(fd,F_SETLK，&lock) 语 
名 实现 了 上 锁 和 解锁 的 设置 。 

为 了 演示 设置 锁 实 现 多 进程 对 共享 资源 (文件 ) 的 互 斥 访问 效果 ,在 第 一 个 终端 上 运 
行程 序 ,结果 如 下 : 

root@ubuntu:~# ./fcntl lock demo 

加 上 写 入 锁 的 是 ， 5844 进 程 

结果 说 明 编号 5844 进程 对 hello. c 文件 加 上 了 写 入 锁 。 

此 时 ,再 开启 另 一 个 终端 ,运行 程序 结果 如 下 : 

root@ubuntu:~# ./fcntl lock demo 

锁 操作 失败 

: Resource temporarily unavailable 

文件 已 经 加 上 了 写 人 锁 , 其 进程 号 是 : 5844 

这 个 运行 结果 说 明 ,在 第 二 个 终端 上 5854 号 进程 设置 写 锁 失败 ,因为 “文件 已 经 加 上 
了 写 人 锁 ,其 进程 号 是 : 5844”. 

第 一 个 终端 继续 运行 程序 , 当 输出 如 下 的 信息 时 ,表示 释放 了 强制 性 锁 。 

root@ubuntu:~ # ./fcntl lock? demo 

加 上 写 人 锁 的 是 : 5844 进 程 


Lnx 环 境 高 级 程序 设计 


释放 强制 性 锁 的 是 : 5844 进程 


此 时 再 次 在 第 二 个 终端 中 运行 程序 ,结果 显示 如 下 ,说明 第 二 终端 进程 5845 可 以 加 
写 人 锁 了 。 


rootQubuntu:- f ./fcntl lock? demo 
锁 操 作 失败 

: Resource temporarily unavailable 

文件 已 经 加 上 了 写 入 锁 , 其 进程 号 是 : 5844 
加 上 写 入 锁 的 是 : 5845 进 程 

释放 强制 性 锁 的 是 : 5845 进 程 

加 上 读 取 锁 的 是 : 5845 进 程 


333 文件 读 写 指 针 的 移动 


lseek 系统 调用 

对 文件 进行 读 写 时 ,会 使 用 到 文件 的 读 写 指针 ,这 个 指针 就 是 文件 的 “当前 文件 偏 移 
量 ”。 它 通常 是 一 个 非 负 整数 ,用 以 度量 当前 读 写 位 置 相对 于 文件 开始 处 偏 移 的 字 节 数 。 
以 读 或 写 方式 打开 文件 时 ,文件 读 写 指针 指向 文件 的 起 始 处 ,若是 以 追加 方式 (O_ 
APPEND) 打 开 文 件 , 则 在 文件 尾部 。 读 / 写 操作 都 从 当前 文件 读 写 指针 位 置 开 始 ,并 使 
文件 读 写 指针 的 位 置 增加 所 读 写 的 字 节 数 。lseek 函数 用 来 修改 文件 的 读 写 指针 位 置 ,可 
以 支持 文件 的 随机 读 写 。lseek 系统 调用 接口 规范 说 明 如 表 3. 8 所 示 。 


表 3.8 lseek 函数 的 接口 规范 说 明 


函数 名 称 lseek 
函数 功能 调整 文件 偏 移 量 位 置 
头 文件 # include <sys/types. h> 


# include <unistd. h> 
函数 原型 off t lseek(int fd. off t offset. int whence? ; 


fd: 要 调整 偏 移 量 位 置 的 文件 的 描述 符 
offset; 新 偏 移 量 位 置 相对 基准 点 的 偏 移 


参数 whence 可 能 值 为 : 

* SEEK SET: 文件 开头 处 

* SEEK CUR: 当前 位 置 

* SEEK END: 文件 的 末尾 处 


新 文件 位 置 偏 移 量 : 成 功 
一 1: 失败 


返回 值 


说 明 : 

对 参数 offset 的 解释 与 参数 whence 的 值 有 关 。 

* 若 whence 是 SEEK_SET, 则 将 该 文件 的 偏 移 量 设置 为 距 文 件 开始 处 offset 个 字 节 。 

© X whence 是 SEEK_CUR, 则 将 该 文件 的 偏 移 量 设置 为 其 当前 位 置 加 offset, 
offset 可 为 正 或 负 。 
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* f; whence 是 SEEK_END, 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 offset. offset 
可 正 可 负 。 

offset 的 值 对 某 些 设备 可 能 允许 负 的 偏 移 量 , 所 以 在 判断 lseek 调用 是 否 成 功 时 应 当 
谨慎 ,不 要 测试 它 是否 小 于 0, 而 是 要 测试 它 是 否 等 于 一 1。 

车 lseek 成 功 执行 , 则 返回 新 的 文件 偏 移 量 ,可 以 用 以 下 的 代码 来 确定 文件 当前 的 偏 
移 量 。 

off 七 currpos; 

currpos- lseek(fd, 0, SEFK CUR) 

这 种 方法 也 可 以 确定 所 使 用 的 文件 是 否 可 以 设置 偏 移 量 。lseek 函数 只 对 普通 文件 
有 效 ,特殊 文件 是 无 法 调整 偏 移 量 的 。 如 果 文 件 描述 符 指向 的 是 一 个 管道 或 网 络 套 接 字 ， 
Jil] lseek 函数 返回 一 1 ,并 将 errno 设置 为 ESPIPE。 

lseek 函数 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 , 它 并 不 引起 任何 1/0 操作 。 然 后 ， 
该 偏 移 量 将 用 于 下 一 个 读 或 写 的 操作 。 文 件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ,在 这 种 情 
况 下 ,对 文件 的 下 一 次 写 操作 将 加 长 该 文件 ,并 在 文件 中 构成 一 个 空洞 ,这 个 操作 在 
Linux 系统 中 是 允许 的 ,位 于 文件 中 但 没有 写 过 的 字 节 都 被 读 为 0。 文 件 中 的 空洞 并 不 要 
求 在 磁盘 上 占用 存储 区 。 

示例 程序 3. 4 使 用 lseek 函数 在 文件 中 产生 了 一 个 空洞 。 


[示例 程序 3.4 holefor redirect.c] 
# include< sys/types.h» 

# include< unistd.h> 

# include< erro.» 

# include< fcntl.h> 


char — bufl[]- "abod"; 
char — buf2[]- "ABCD"; 


int main (void) 
t 
int fd; 


if ((fd-cpen("file.hole",O RDWR|O CFEAT|O TRUNC, 0644) )- — - 1) 
perror ("creat error"); 


if (write (fd,bu£l,4) != 4) 
perror ("bufl write error"); 
/* offset now-4* / 


if(lseck(fd,200,SEEK CUR)-— - 1) 
perror ("1seek error"); 
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/* offet now-204* / 


if (write (fd,bu£2,4) != 4) 
perror ("buf2 write error"); 
/* offset now- 208% / 


close (fd); 
retum 0; 
) 


示例 程序 中 第 一 次 使 用 write 函数 将 文件 file. hole 的 读 写 指针 定位 到 4, 随 后 调用 
lseek 函数 将 读 写 指 针 向 后 偏 移 200 字 节 , 即 定 位 到 204, 接 着 再 次 调用 write 函数 将 读 写 
指针 定位 到 208。 编 译 并 运行 程序 后 观察 file. hole 文件 的 情况 如 下 : 


root@ubuntu:#13 - 1 file.hole 
-rw-r--r--1rootroot208 3 月 27 22:23 file.hole 


从 结果 中 可 以 看 到 ,文件 file. hole 的 大 小 为 208 字 节 。 对 该 文件 执行 od 命令 得 到 : 


root@ubuntu:3# od - c file.hole 
000000 a b c d NO NO NO NO NO. NO NO. NO. NO. NO. NO. NO 
0000000 NO NO NO NO. NO. NO. NO. NO. NO. NO. NO. NO. NO. NO. NO. NO 


* 
0000800 NO. NO. NO. NO. NO NO. NO NO NO NO NO VO A B C D 
0000320 


od 命令 后 的 选项 -c 表示 以 字符 方式 输出 文件 内 容 。 从 中 可 以 看 出 ,文件 中 间 的 200 
个 未 写 入 字 节 都 被 读 为 0。 每 一 行 开 始 的 7 位 数 是 以 八进制 形式 表示 的 字 节 偏 移 量 。 


334 标准 JO 的 文件 流 


标准 L/O 库 提 供 了 许多 与 标准 1/0 操作 相关 的 函数 。 使 用 标准 L/O 函数 访问 文件 
的 流程 与 使 用 POSIX 1/0 函数 访问 文件 的 流程 类 似 : 首先 需要 打开 一 个 文件 以 建立 一 个 
访问 路 径 , 打 开 操 作 的 返回 值 将 作为 其 他 1/0 库 函 数 的 参数 对 文件 进行 访问 或 关闭 。 在 标 
准 W/O 库 中 ,每 个 被 访问 的 文件 将 会 与 一 个 称 为 流 (stream) 的 指针 关联 ,在 C 程序 中 流 的 类 
型 为 FILE 类 型 的 指针 。 可 用 的 文件 流 数量 和 文件 描述 符 一 样 ,都 是 有 限制 的 。 实 际 的 限 
制 由 头 文件 stdio. h 中 声明 的 宏 FOPEN_MAX 来 定义 ,在 Linux 系统 中 通常 是 16。 

在 启动 程序 时 ,系统 将 会 自动 打开 stdin、stdout、stderr 这 三 个 文件 流 , 它 们 的 定义 位 
于 stdio. h 头 文件 ,分 别 代表 标准 输入 、 标 准 输出 和 标准 错误 ,与 文件 描述 符 0、1、2 相对 
应 。 每 个 进程 默认 从 标准 输入 流 中 读数 据 、 向 标准 输出 流 输 出 信息 ,向 标准 错误 输出 流 写 
错误 信息 。 

1. fopen 函数 

fopen 函数 用 于 打开 文件 ,调用 fopen 函数 成 功 后 ,将 会 建立 流 指针 与 文件 的 关联 ,其 
接口 规范 说 明 如 表 3.9 所 示 。 
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33.9 fopen 函数 的 接口 规范 说 明 


函数 名 称 fopen 
函数 功能 获取 指定 文件 的 文件 指针 
头 文件 # include —stdio. h> 
函数 原型 FILE * fopen(const char * path, const char * mode); 
参数 path: 要 打开 含 路 径 的 文件 名 
mode: 文件 打开 的 方式 
y 指向 FILE 的 指针 : 成 功 
iani NULL. 失败 
Ji]. 


参数 mode 用 来 说 明文 件 的 打开 方式 , 它 可 以 取 下 列 某 个 字符 串 的 值 。 

e “PR rb”: 以 只 读 方式 打开 文件 ,该 文件 必须 存在 ,文件 不 存在 则 打开 失败 。 

。“r 十 ”或 “rb 十 ”或 “r 十 b”: 以 读 / 写 方式 打开 文件 ,该 文件 必须 存在 ,文件 不 存在 则 
打开 失败 。 

“wR wb”: 以 只 写 方式 打开 文件 ,如 果 文 件 不 存在 会 创建 新 文件 ,如 果 存 在 会 
将 其 内 容 清空 。 

“w 十 ”或 “wb 十 ”或 “w 十 b”: 以 读 / 写 方式 打开 文件 ,如 果 文 件 不 存在 会 创建 新 文 
件 。 如 果 存 在 会 将 其 内 容 清 空 。 

“a" 或 “ab”: 以 只 写 方式 打开 文件 ,如 果 文 件 不 存在 会 创建 新 文件 , 且 文 件 位 置 偏 
移 量 被 自动 定位 到 文件 末尾 ( 即 以 追加 方式 写 数据 ) ,文件 原先 的 内 容 会 被 保留 。 

“a 十 ”或 “ab 十 ”或 “a 十 b”: 以 读 / 写 方式 打开 文件 ,如 果 文 件 不 存在 会 创建 新 文件 ， 
且 文 件 位 置 偏 移 量 被 自动 定位 到 文件 末尾 ( 即 以 追加 方式 写 数据 ) ,文件 原先 的 内 
容 会 被 保留 。 

字母 b 表示 文件 是 一 个 二 进 制 文件 而 不 是 文本 文件 。 

返回 的 文件 指针 是 一 个 指向 FILE 结构 体 的 指针 ,该 结构 定义 如 下 。 


//come fro stdio.h 
typedef struct IO FIIE FIIE; 


//oame from libio.h 
struct IO FIE { 
int flags; /* High- order word is IO MAGIC; rest is flags. * / 
# define IO file flags flags 


/* Tre following pointers correspond to the C++ streembuf protocol. * / 
/* Note: Tkusesthe IO read ptr and 1O read end fields directly. * / 
char* IO read ptr; /* Current read pointer * / 

char* IO read end; /* End of get area. * / 

char# IO read base; — /* Start of putbackt get area. * / 

char* IO write base;  /* Start of put area. * / 

char* IO write ptr; /* Current put pointer. * / 

char* IO write end; — /* Endof put area. * / 
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char* IO buf base; —— /* Start of reserve area. * / 
charx IO buf end; /* End of reserve area. * / 


在 FILE 结构 体 定义 中 ,_fileno 即 文件 描述 符 , 同 时 FILE 结构 体 中 还 提供 了 一 组 
char 类 型 的 指针 用 来 管理 数据 缓冲 区 。 文 件 指针 和 文件 描述 符 的 关系 如 图 3. 9 所 示 。 


FILE(j 
test.c 文 件 指针 


char* IO read ptr; 内 核 缓冲 区 
char* IO read end; 
char* IO read base; Buffer 站 二 >] buffer 
Td-fopen() —* char* IO write base; 1 
char* IO write ptr; 1 
char* IO write end; iL* 

1 

1 

1 

1 

1 


I 
1 
标准 IO 缓冲 区 | 
I 
I 


char* IO buf base; 
char* IO buf end; 


int, _fileno; -— — ——---L--------- J 


i 

fd array[] — file(] 
1 内 核 空间 
图 3.9 文件 指针 和 文件 描述 符 的 关系 


用 户 空间 


可 以 看 到 ,使 用 标准 1/0 函数 处 理 文件 的 最 大 特点 是 : 数据 将 会 先 存储 在 一 个 标准 
1/0 缓冲 区 中 ,而 后 在 一 定 条 件 下 才 被 冲洗 (flush) 至 内 核 缓 冲 区 中 ,而 不 是 像 系统 IO 
那样 ,数据 直接 被 冲洗 至 内 核 。 
标准 1/O 函数 fopen 实质 上 是 系统 1/0 函数 open 的 封装 ,它们 是 一 一 对 应 的 ,每 一 
次 fopen 都 会 导致 系统 分 配 一 个 file 结构 体 和 一 个 FILE 结构 体 来 保存 维护 该 文件 的 读 / 
写 信息 ,每 一 次 的 打开 操作 都 不 一 样 ,是 相对 独立 的 ,因此 可 以 在 多 线程 或 多 进程 中 多 次 
打开 同一 个 文件 。 使 用 fdopen 和 fileno 函数 可 以 实现 FILE 类 型 文件 指针 和 文件 描述 符 
之 间 的 互相 转换 。 
2. fclose 函数 
fclose 函数 类 似 于 系统 调用 close。 在 完成 文件 的 读 写 操作 后 ,可 使 用 fclose 函数 以 
流 对 象 为 参数 关闭 文件 。fclose 在 关闭 文件 之 前 ,会 将 缓冲 区 中 的 相关 内 容 冲 洗 到 对 应 
的 文件 中 。 只 要 程序 是 正常 退出 的 ,即使 没有 调用 fclose 函数 ,Linux 系统 也 能 保证 冲洗 
操作 正确 执行 。fclose 函数 接口 规范 说 明 如 表 3. 10 所 示 。 
表 3.10 fclose 函数 的 接口 规范 说 明 
函数 名 称 fclose 
函数 功能 关闭 指定 文件 并 释放 其 资源 
头 文件 # include <stdio. h> 


第 3 章 ， 文 件 及 目录 管理 w^. 


ZW 
函数 原型 int *fclose(FILE * fp); 
参数 fp: 即将 要 关闭 的 文件 
$ 0: 成 功 
mai EOF; 失败 
3. fileno 函数 


fileno 函数 可 以 从 FILE 类 型 结构 体 中 获取 文件 描述 符 。 该 函数 的 参数 为 FILE 类 
型 的 结构 体 指针 变量 ,该 指针 即 打开 文件 时 获得 的 文件 流 指 针 ,执行 成 功 后 ,将 会 返回 一 
个 文件 描述 符 , 这 个 文件 描述 符 和 参数 的 文件 流 指针 指向 同一 个 打开 的 文件 。fileno FR 
数 的 接口 规范 说 明 如 表 3. 11 Bros s 


表 3.11 fileno 函数 的 接口 规范 说 明 


函数 名 称 fileno 

函数 功能 获取 文件 描述 符 

头 文件 # include <stdio. h> 
函数 原型 int filenoCFILE * stream); 
参数 stream; 文件 的 流 指针 
返回 什 e 


读者 可 以 通过 示例 程序 3. 5 来 学 习 fileno 函数 的 使 用 方法 。 


[示例 程序 3.5 exp. fileno.c] 

# include« stdio.h» 

main() 

{ 
printf ("File no of stdin is:\t%d\n", fileno(stdin)); 
printf ("File no of stdout is:\t%d\n", fileno(stdout)); 
printf ("File no of stderr is:\t%d\n", fileno(stderr)); 
retum 0; 

} 


在 示例 程序 3. 5 中 ,程序 调用 fileno 函数 获取 三 个 标准 L/O 设备 的 文件 描述 符 , 其 运 
行 结果 如 下 : 


root@ubuntu:~ # gcc fileno exp.c -o fileno exp 
root&ubuntu:- # ./fileno exp 


stdin is: 0 
stdoutis: 1 
stderr is: 2 


即 标准 输入 设备 的 文件 描述 符 为 0 ,标准 输 出 设备 的 文件 描述 符 为 1, 标 准 错误 设备 的 
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文件 描述 符 为 2。 在 此 头 文件 正确 头 文件 中 可 以 查找 到 Linux 系统 对 于 这 三 个 标准 设 
备 的 说 明 如 下 。 可 以 看 到 系统 对 标准 设备 文件 的 说 明和 示例 程序 3. 5 的 运行 结果 完全 
= 

//omme fra /usr/include/unistd.h 

/* Standard file descriptors.* / 

#define SIDIN FIENO 0 /* Standard input. * / 

# define STDOUT FIIENO 1 /* Standard output. * / 

# define STERR FIIENO 2 /* Standard error output. * / 

4. fdopen 函数 

fdopen 函数 会 返回 一 个 与 参数 fd 所 指 文件 相关 联 的 文件 流 指 针 , 第 二 个 参数 mode 
表示 该 文件 流 的 模式 , 即 文件 的 使 用 方式 。 参 数 mode 的 类 型 为 字符 指针 ,可 选 的 字符 串 
值 与 fopen 函数 中 mode 可 选 的 值 相 同 , 各 字符 串 的 含义 也 一 样 。 但 是 要 注意 ,fdopen rf 
数 中 的 mode 必须 与 参数 fd 的 使 用 方式 是 兼容 的 。 在 使 用 fd 产生 了 文件 流 指针 之 后 ,该 
流 指针 的 读 写 位 置 与 文件 描述 符 fd 一 致 ,关闭 文件 时 ,使 用 close 函数 关闭 fd 所 指 文件 
将 会 导致 相应 文件 流 指 针 也 不 可 再 继续 使 用 。 使 用 fclose 函数 关闭 文件 流 指 针 同样 也 会 
使 文件 描述 符 fd 与 文件 失去 联系 。fdopen 函数 的 接口 规范 说 明 如 表 3. 12 所 示 。 


表 3.12 fdopen 函数 的 接口 规范 说 明 


函数 名 称 fdopen 

函数 功能 将 文件 描述 符 转 换 为 流 指针 

头 文件 include —stdio. h> 

函数 原型 FILE * fdopen(int fd, char * mode); 
fd: 文件 描述 符 

参数 mode 文件 流 的 模式 

r 非 空 值 : 成 功 

NULL: 失败 


示例 程序 3.6 是 一 个 使 用 fdopen 创建 文件 流 指针 的 示例 。 程 序 中 使 用 open 函数 以 
只 读 方 式 打 开 了 当前 目录 下 的 test. txt 文件 ,将 文件 描述 符 赋 给 fd; 随后 使 用 fdopen FR 
数 通过 fd 创建 了 文件 流 指针 stream。 若 创建 成 功 , 则 fprintf 函数 使 用 流 指针 stream 向 
文件 写 和 人 字符 串 “This is to test fdopen. ”, 紧 接着 使 用 fclose 函数 以 stream 为 参数 关闭 
了 文件 。 最 后 输出 使 用 close 函数 以 fd 为 参数 关闭 文件 时 的 返回 值 。 


[示例 程序 3.6 exp. fdopen.c] 
# includec stdio.h» 
# include fentl.h» 
# inlcude« sys/stat.h» 
mein() 
( 

int fd 
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FOE  * stream; 
fd-open("test.txt",O CREAT|O WEONLY, S IREAD|S IWEITE); 
streame fdopen (fd, "w") ; 
if (stream= = NULL) 
printf ("fdopen error."); 
else 
t 
fprintf (stream, "This is to test fdopen.An"); 
fclose (stream); 
) 
printf ("return value of close- &dWn", close (fd)) ; 
retum 0; 
} 


示例 程序 3.6 的 运行 结果 如 下 : 


root@ubuntu:~ # gcc fdopen exp.c -o fdopen exp 

root@ubuntu:~ # ./fdopen exp 

return value- - 1 

rootGubuntu:^ # cat test.txt 

This is to test fdopen. 

rootGubuntu:^ d 

从 结果 可 以 看 出 使 用 fclose 函数 关闭 文件 后 ,再 使 用 close 关闭 文件 产生 了 错误 ,使 
用 cat 命令 查看 test. txt 文件 的 内 容 , 可 以 看 到 ,通过 流 指针 将 信息 写 人 了 文件 ,说 明 fd 
和 stream 与 同一 个 文件 产生 了 关联 。 有 兴趣 的 读者 可 以 尝试 改造 程序 验证 fd 和 stream 
的 读 写 位 置 是 相同 的 。 


3.4 文件 属性 及 相关 系统 调用 


Linux 中 的 每 个 文件 都 有 许多 属性 ,这 些 属性 描述 了 文件 的 一 些 特征 或 者 记录 了 文 
件 当前 的 状态 信息 ,比如 文件 属性 包含 所 有 者 的 用 户 id、 文 件 的 结 点 编号 i-node 和 文件 
最 近 一 次 被 访问 的 时 间 等 。 
341 获取 文件 属性 


在 程序 中 可 以 通过 stat/fstat/Istat 系统 调用 来 获取 文件 的 属性 ,其 接口 规范 说 明 如 
K 3. 13 所 示 。 


表 3. 13 stat/fstat/lstat 函数 的 接口 规范 说 明 


函数 名 称 stat/fstat/lstat 
函数 功能 获取 文件 属性 


`o Lnx 环 境 高 级 程序 设计 


S 


# include —sys/types. h> 


头 文件 # include <sys/stat. h> 
# include <unistd. h> 
int stat(const char * path, struct stat * buf); 
函数 原型 int fstatCint fd, struct stat * buf); 
int lstat(const char * path, struct stat * buf) ; 
path: 文件 路 径 
参数 fd: 文件 描述 符 
buf: 文件 属性 结构 体 
" 0: 成 功 
niai NULL: 失败 
说 明 : 


这 3 个 系统 调用 功能 类 似 , 区 别 在 于 ,stat 用 于 获取 由 参数 file name 指定 的 文件 名 
的 状态 信息 ,将 获取 的 信息 保存 到 参数 struct stat * buf 中 。fstat 与 stat 的 区 别 在 于 
fstat 通过 文件 描述 符 来 指定 文件 。1stat 与 stat 的 区 别 在 于 ,对 于 符号 链接 文件 ,lstat i 
回 的 是 符号 链接 文件 本 身 的 状态 信息 ,而 stat 返回 的 是 符号 链接 指向 的 文件 信息 。 

参数 struct stat * buf 是 一 个 保存 文件 状态 信息 的 结构 体 ,结构 的 实际 定义 可 能 随 
具体 实现 有 所 不 同 ,但 其 基本 形式 是 : 


struct stat 

{ 
dev t st dev; 
ino t st ino; 
mode t st mode; 
nlink t st nlink; 
uid t st uid; 
gid t st gid; 
dev t st rdev; 
off t st size; 
blksize t st blksize; 
blkcnt t st blocks; 
time t st atime; 
time t st mtime; 
time t st ctime; 

E 

其 中 各 个 域 的 含义 如 下 : 


* st dev: 文件 所 在 设备 的 ID. 
* st ino: 结 点 号 inode。 


* st mode: 文件 的 类 型 和 存 取 权限 , 它 的 含义 与 open, write, chmod 函数 的 mode 


参数 相同 。 
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st nlink; 连 到 此 文件 的 链接 数目 ( 硬 链接 ) 。 

st_uid: 文件 所 有 者 的 用 户 id。 

st_gid: 文件 所 有 者 的 组 id。 

st_rdev: 设备 编号 ,此 文件 为 设备 文件 。 

st_size: 文件 大 小 ,单位 为 字 节 ,对 符号 链接 ,大 小 是 其 所 指向 的 文件 名 的 长 度 。 
st_blksize: 文件 系统 的 1/0 缓冲 区 大 小 。 

st blocks: 占用 数据 块 的 个 数 ,数据 块 大 小 通常 为 512 个 字 节 。 

st_atime: 文件 最 近 一 次 被 访问 的 时 间 。 

st_mtime: 文件 最 后 一 次 修改 的 时 间 ,一 般 只 能 调用 utime 和 write 函数 时 才 会 
改变 。 

st_ctime: 文件 最 近 一 次 被 更 改 的 时 间 , 此 参数 在 文件 所 有 者 、 所 属 组 文件 权限 
被 更 改 时 更 新 。 


下 面 通过 示例 程序 3. 7 ,演示 如 何 获取 文件 的 属性 。 


[示例 程序 3.7 1stat demo.c] 
# includec stdio.h» 

# includec time.h> 

# include< sys/stat.h> 

# include< unistd.h> 

# include< sys/types.h> 

# include< ermo.h> 


int main (int argc ,char * argv[]) 


{ 


struct stat buf; 
char * ptr; 
// 检 查 moin 函数 参数 个 数 
if(argct- 2) 
t 
printf("Usage:lstat demcx filename» Xn"); 
exit(0); 
) 
/获得 文件 属性 
if (lstat (argv[1], &buf)- — - 1) 
t 
perror("lstat error"); 
exit); 
i 
// 打 印 文件 属性 
printf("device is: Sd\n",buf.st dev); 
printf ("inod is: &dWn",buf.st ino); 
printf ("mode is: &dWn",buf.st mode); 
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printf ("number of hard links is: $dWn",buf.st nlink); 
printf ("user ID of owner is: $dWn",buf.st uid); 
printf ("group ID of owner is: $dWn",buf.st gid); 
printf ("total size,in bytes is: $dWn",buf.st size); 
printf("blocksizefor filesystem is: $dWn", Vbuf.st blksize); 
printf ("number of blocks allocated is: %d\n",buf.st blocks); 
if(S ISREG(buf.st mode)) 
ptr- "regular"; 
else if(S ISDIR(buf.st mode)) 
ptr- "directory"; 
else if(S ISCHR(buf.st mode)) 
ptr- "character special"; 
else if(S ISBIK(buf.st mode)) 
ptr- "block special"; 
else if(S ISFIFO(buf.st mode)) 
ptr- "fifo"; 
else if(S ISINK(buf.st mode)) 
ptr- "syrbolic link"; 
else if(S ISSOCK(buf.st mode)) 
ptr- "socket"; 
else 
ptr-"** unknown mode** "; 
printf ("53V n", ptr) ; 
retum 0; 
) 


示例 程序 3.7 编译 后 运行 结果 如 下 : 


rootéubuntu: # ./lstat demo /dev/odrom 

device is: 6 

inod is: 10695 

mode is: 41471 

muriber of hard links is: 1 

user ID of owner is: 0 

group ID of owner is: 0 

total size,in bytes is: 3 

blocksize for filesystem I/O is: 4096 

number of blocks allocated is: 0 

synbolic link 

程序 中 使 用 了 Istat 函数 是 为 了 方便 检测 符号 链接 , 若 使 用 stat 函数 , 则 不 会 观察 到 
符号 链接 。 从 上 面 程序 的 运行 结果 可 以 看 出 ,设备 cdrom 也 是 作为 文件 来 处 理 的 ,文件 
系统 数据 块 大 小 为 4096 字 节 ,因为 cdrom 是 符号 链接 文件 ,因此 并 没有 真实 的 数据 ,所 
以 文件 数据 块 数量 为 0。 


342 修改 文件 的 访问 权限 


1. chmod/fchmod 系统 调用 
可 以 通过 chmod 和 fchmod 系统 调用 对 文件 的 访问 权限 进行 修改 。chmod 和 
fchmod 函数 接口 规范 说 明 如 表 3. 14 所 示 。 


表 3.14 chmod/fchmod 函数 的 接口 规范 说 明 


mos sanae \D/ 


函数 名 称 chmod/fchmod 

函数 功能 修改 文件 访问 权限 

头 文件 # include <sys/stat. h> 
int chmod(const char * path, mode t mode) ; 

函数 原型 int fchmod(int fd, mode t mode); 
path; 要 修改 的 文件 含 路 径 的 文件 名 

参数 fd. 要 修改 文件 对 应 的 文件 描述 符 
mode: 修改 的 权限 描述 

j 0: 成 功 

sin 一 1: 失败 

说 明 : 


chmod/fchmod 的 区 别 是 chmod 以 文件 名 作为 第 一 个 参数 ,fchmod 以 文件 描述 符 为 
第 一 参数 。 权 限 更 改 成 功 返 回 0, 失 败 返 回 一 1, 错 误 代 码 存放 在 系统 预定 义 全 局 变量 
errno 中 ,错误 代码 含义 请 参考 man 手册 。 

参数 mode 取 如 表 3. 15 所 示 的 几 种 组 合 ,可 以 使 用 或 “| 来 进行 权限 的 组 合 。 例 如 ， 
使 用 chmod(“hello. c”,S_IRUSR|S_IWUSR|S_IWOTH) ,可 以 将 hello. c 文件 的 访问 权 
限 设置 为 所 有 者 读 和 写 权 限 .其 他 用 户 为 写 权 限 。 


表 3.15 参数 mode 的 值 


字符 常量 值 字符 常量 值 对 应 的 八进制 值 *& x 

S IRUSR 00400 所 有 者 读 权限 

S IWUSR 00200 所 有 者 写 权限 

S IXUSR 00100 所 有 者 执行 权限 
S_IRGRP 00040 所 属 组 成 员 读 权限 
S IWGRP 00020 所 属 组 成 员 写 权限 
S_IXGRP 00010 所 属 组 成 员 执 行 权限 
S_IROTH 00004 其 他 用 户 读 权限 

S IWOTH 00002 其 他 用 户 写 权限 
S_IXOTH 00001 其 他 用 户 执行 权限 
S_ISUID 04000 文件 的 suid 位 
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E 
字符 常量 值 字符 常量 值 对 应 的 八进制 值 £ x 
S_ISGID 02000 文件 的 sgid 位 
S_ISVTX 01000 文件 的 sticky 位 


利用 chmod 函数 可 以 实现 自己 的 简化 版 chmod 命令 。 实 现代 码 如 示例 程序 3. 8 所 示 。 


[示例 程序 3.8 simple chmod.c] 
# includec stdio.h» 

# inclucec stdlib.h> 

# includec sys/types.h» 

# includec sys/stat..h» 


int main(int argc, char **argv) 


t 


int mode; // 权 限 

int — mdeu // 所 有 者 权限 

int mode g; // 所 属 组 权限 

int mæ o; // 其 他 用 户 的 权限 


char * path; 


/* 检查 参数 个 数 的 合法 性 * / 
if (argc< 3) 
{ 


printf ("$s «mode mnber> < target file» \n",argv[0]); 


) 


/* 获取 命令 行 参数 * / 
mpde= atoi (argv[1]); 
if (mode» 777| | mode« 0) 
t 
printf ("mode number error!\n"); 
exit (0); 
r 
mode u-mode/100; 
mode g- (mode- (mode u* 100))/10; 
mode o-mode- (mode u* 100)- (mode gx 10); 
mode- (mode u* 8* 8)+ (mde gx 8)+mode o; 
path- argv[2]; 


if(dmod(path,mode)-— - 1) 
1 
perror ("amd errro") ; 


// 八 进 制 转换 
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retum 0; 
) 


通过 demo. c 程序 来 进行 测试 。 


root@ubuntu:~ # ./simple chmod 777 demo.c 
rootQubuntur- # ls - 1 
— rwxrwxrwx 1 root root 2 3H 2817:01 dem.c 


从 运行 结果 看 ,demo. c 的 访问 权限 已 经 改 为 所 有 者 可 读 可 写 可 执行 ,所 有 者 所 在 组 
写 


可 读 可 写 可 执行 ,其 他 用 户 可 读 可 写 可 执行 。 
运行 simple. chmod 程序 时 ,输入 一 条 命令 . /simple _chmod 和 2 个 参数 777 与 


demo. cy, 因此 agre 传人 的 值 为 3,argv[0] 接 收 的 是 . /simple,,argv[1] 接 收 的 是 777, 
argv[L2] 接 收 的 是 demo. c. atoi 函数 是 将 字符 串 转 换 为 整 型 数 ,因为 用 户 输入 的 777 是 字 
符 型 值 ,所 以 需要 使 用 atoi 函数 将 字符 “777” 转 换 为 整数 777。 
343 修改 文件 的 用 户 属性 
编写 程序 时 ,可 以 使 用 chown/fchown/lIchown 函数 修改 用 户 id 和 组 id。 其 接口 规 
范 说 明 如 表 3. 16 Bron o 
表 3.16 chown/fchown/Ichown 函数 的 接口 规范 说 明 


函数 名 称 chown/fchown/lchown 
函数 功能 修改 用 户 id 和 组 id 
头 文件 # include —unistd. h> 
int chown(const char * path. uid t owner, gid t group); 
函数 原型 int fchown(int fd, uid t owner, gid t group); 
int lchown(const char * path, uid t owner, gid t group); 
path; 文件 路 径 名 
参数 owner: 所 有 者 
group: 组 
0: 成 功 (修改 成 功 ) 
返回 值 一 1, 失败 
说 明 : 


chown 会 将 参数 path 指定 的 文件 所 有 者 id 变更 为 owner 代表 的 用 户 id, 而 将 文件 
所 有 者 的 组 id 变更 为 参数 group 组 id。fchown 与 chown 类 似 ,只 不 过 它 是 以 文件 描述 
符 作 为 参数 。 除 了 所 引用 的 文件 是 符号 链接 外 ,lchown 与 chown 功能 一 样 ,lchown 更 改 
符号 链接 本 身 的 所 有 者 id, 而 不 影响 符号 链接 所 指向 的 文件 。 

文件 的 所 有 者 只 能 改变 文件 的 组 id 为 其 所 属 组 中 的 一 个 ,超级 用 户 才能 修改 文件 的 
所 有 者 id, 并 且 超 级 用 户 可 以 任意 修改 文件 的 用 户 组 id。 如 果 参 数 owner 或 group 指定 
为 一 1, 那 么 文件 的 用 户 id 和 组 id 不 会 被 改变 。 
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这 几 个 函数 执行 成 功 时 返回 0, 当 有 错误 发 生 时 返回 一 1, 错 误 代码 存 人 errno 中 。 
344 获取 用 户 的 信息 


getpwuid 和 getpwnam 函数 是 标准 L/O 函数 ,可 以 通过 用 户 id 或 用 户 名 查看 某 特定 
用 户 的 基本 信息 。getpwuid 和 getpwnam 函数 接口 规范 说 明 如 表 3. 17 所 示 。 


表 3.17 getpwuid/getpwnam 函数 的 接口 规范 说 明 


函数 名 称 getpwuid/getpwnam 
函数 功能 查看 用 户 的 基本 信息 
# include 一 sys/types. h> 
头 文件 # include 一 pwd. h> 
struct passwd * getpwnam(const char * name) ; 
函数 原型 struct passwd * getpwuid(uid t uid); 
name: 用 户 名 
on uid: 用 户 id 
返回 什 返回 指针 ,指向 与 uid 或 name 匹配 的 用 户 基本 信息 : 成 功 
返回 一 个 空 指针 并 设置 errno 的 值 : 失败 
说 明 : 


Linux 系统 中 ,用 户 的 基本 信息 使 用 struct password 结构 体 来 描述 ,该 结构 体 在 
pwd. h 文件 中 进行 了 声明 ,声明 如 下 。 


struct passwd { 
char — * pw name; /* 用 户 名 * / 
char * pw passwd; /* 用 户 密码 * / 
uid t pu uid; /* 用 户 ID* / 
gid t pw gid; /* Hl 10* / 
char — * pw goos; /x# 注释 * / 
char * pa dir; /* 主 目录 * / 
chr è *pw shell; /* 默认 Sneni 2698 * / 


k 


pw_passwd 为 密码 ,如果 密码 存储 在 /etc/shodw 文件 中 只 能 返回 x, 不 能 返回 密 文 ， 
部 分 系统 密 文 存放 到 /etc/shadow 文件 中 。 

函数 getpwuid 和 getpwnam 调用 成 功 都 返回 一 个 指针 ,指向 与 uid 或 name 匹配 的 
用 户 基本 信息 ;车 出 错 ,它们 都 返回 一 个 空 指针 并 设置 errno 的 值 ,用 户 可 以 根据 perror 
函数 查看 出 错 的 信息 。 

示例 程序 3. 9 使 用 getpwuid 函数 获取 用 户 基本 信息 的 程序 。 

[示例 程序 3.9 getpwuid demo.c] 

# include< stdio.h> 

# include< pwd.h> 

# include< stdlib.h> 
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int main (int argc, char * argv[]) 

t 
struct passwd * ptr; 
uid t uid; 
uid atoi (argv[1]); 
ptr=gætpwid(uid); 
printf("name:$sWn",ptr- »pw name); 
printf ("passwd:&sWn",ptr- » pw passwd); 
printf ("home dir:ssNnwptr » pw dir); 
return 0; 

} 


编译 后 运行 该 程序 ,结果 如 下 : 

root@ubuntu:~ # ./getpwuid demo 0 

name:root 

passwd:x 

hame dir:/root 

函数 getgrgid 和 getgrnam 可 以 通过 用 户 组 GID 或 用 户 组 名 查看 某 特定 用 户 的 基本 
信息 ,通过 man getgrgid 命令 获得 函数 原型 声明 如 下 。 


# include< sys/types.h> 

# include< grp.h> 

struct group * getgrnam(const char * name); 
struct group * getgrgid(gid t gid); 


以 上 两 个 函数 都 将 从 /etc/group 文件 中 读 取 该 用 户 组 的 基本 信息 ,该 结构 体 声明 如 下 。 


struct group ( 
char  * gr name; /x* 组 名 */ 
char * gr passwd; /x* i y 
gidt gr gid; /* H GID* / 
char  **gr mem; /* 成 员 列表 / 


hu 


345 改变 文件 大 小 
可 以 使 用 truncate 和 ftruncate 系统 调用 改变 文件 的 大 小 ,其 接口 规范 说 明 如 表 3. 18 所 示 。 
表 3.18 truncate/ftruncate 函数 的 接口 规范 说 明 


函数 名 称 truncate/ftruncate 


函数 功能 改变 文件 大 小 


# include —unistd. h> 


SES £ include —sys/types. h> 


int truncate(const char * path. off t length); 
int ftruncate(int fd, off t length) ; 


函数 原型 
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续 表 
path: 包含 文件 名 的 文件 路 径 
参数 fd: 文件 描述 符 
length: 文件 大 小 
y 0: 成 功 
ERK 一 1: 失败 
说 明 : 


系统 调用 truncate 和 ftruncate 功能 相同 ,区 别 是 truncate 使 用 了 字符 串 类 型 的 “ 包 
含 文件 名 的 文件 路 径 ”" 作 为 参数 ,而 ftruncate 使 用 打开 的 一 个 文件 描述 符 fd 作为 参数 。 
truncate 将 参数 path 指定 的 文件 大 小 改 为 参数 length 指定 的 大 小 。 如 果 原 来 文件 的 大 
小 比 参数 length 大 , 则 超过 的 部 分 会 被 删除 ;如 果 原 来 的 文件 大 小 比 参数 length 小 , 则 文 
件 将 被 扩展 ,与 lseek 系统 调用 类 似 , 文 件 扩 展 的 部 分 将 以 0 填充 。 如 果 文 件 大 小 被 改变 


了 , 则 文件 的 st mtime 域 和 st_ctime 域 将 会 被 更 新 。 
函数 执行 成 功 时 返回 0, 当 有 错误 发 生 时 返回 一 1, 错 误 代码 存 入 error 中 。 


346 获取 文件 的 时 间 属 性 


在 Shell 环境 中 ,可 以 通过 命令 “ls 一 文件 名 二 -lu”" 和 “ls 去 文件 名 二 -lc" 来 查看 文件 


“最 近 一 次 访问 的 时 间 ” 和 “最 近 一 次 修改 属性 的 时 间 ”。 


root@ubuntu:~ # 1s hello.c -lu // 最 近 一 次 访问 时 间 , 加 -u 参 数 
-rw-r--r--lrootroot 7] 1 月 15 07:42 hello.c 
root@ubuntu:~ # 1s hello.c -lc // 最 近 一 次 修改 时 间 , 加 -c 参 数 
-rw-r--r--lrootroot 71 1 月 1112:17 hello.c 


在 编写 程序 时 ,如 果 要 修改 文件 的 最 近 一 次 访问 时 间 和 最 近 一 次 修改 时 间 ,可 以 调用 
utime 函数 。 在 修改 以 上 两 个 时 间 时 ,最 近 一 次 修改 时 间 也 会 被 更 新 为 当前 时 间 , 如 果 调 
用 utime 函数 时 各 时 间 值 设置 为 NULL, 则 将 最 近 一 次 访问 时 间 和 最 近 一 次 修改 时 间 设 


置 为 当前 系统 时 间 。nutime 系统 调用 接口 规范 说 明 如 表 3. 19 所 示 。 


表 3.19 utime 函数 的 接口 规范 说 明 


函数 名 称 utime 
函数 功能 获取 文件 的 时 间 属 性 
dt include «sys/types. h> 
头 文件 * include — utime. h> 
# include — sys/time. h> 
函数 原型 int utimeCconst char * filename. const struct utimbuf * times); 
int utimes(const char * filename, const struct timeval times[2]) ; 
参数 filename: 字符 串 文 件 名 
times: 指向 存储 访问 和 修改 时 间 的 结构 体 utimbuf 指针 
PIE o 


一 1: 失败 
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说 明 : 
参数 struct utimbuf * times 的 定义 如 下 : 


struct utimbuf ( 


time t actime; /* access time * / 
time t mdtime; /* modification time* / 


iH 


utime 系统 调用 指定 文件 filename 的 访问 时 间 改 为 times. actime 域 指定 的 时 间 , 把 
修改 时 间 改 为 times. modtime 域 指定 的 时 间 。 
函数 执行 成 功 时 返回 0, 当 有 错误 发 生 时 返回 一 1, 错 误 代码 存 人 errno 中 。 


3.5 目录 操作 


对 某 个 目录 具有 访问 权限 的 任何 一 个 用 户 都 可 以 读 该 目录 ,但 是 ,为 了 防止 文件 系统 
产生 混乱 ,只 有 内 核 才 能 写 目录 ,一 个 目录 的 写 权 限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 
否 创建 新 文件 及 删除 文件 ,它们 并 不 表示 能 否 写 目 录 本 身 。 

Linux 系统 中 一 个 常见 的 问题 是 扫描 目录 ,也 就 是 确定 一 个 特定 目录 下 存放 的 文件 。 
标准 1/0 库 函 数 提供 了 很 多 操作 目录 的 函数 ,常见 的 目录 函数 有 opendir、readdir 和 
closedir 函数 ,在 这 些 函 数 的 支持 下 ,读者 可 以 实现 一 个 目录 扫描 的 程序 。 

与 目录 操作 有 关 的 函数 在 dirent. h 头 文件 中 声明 。 它 们 使 用 一 个 名 为 DIR 的 结构 作为 
目录 操作 的 基础 。 被 称 为 目录 流 的 指向 这 个 结构 的 指针 (* DIR) 被 用 来 完成 各 种 目录 操 
作 , 其 使 用 方法 与 用 来 操作 普通 文件 的 文件 流 (FILE * ) 或 文件 描述 符 (fd) 非 常 相似 。 


351 打开 目录 


opendir 函数 用 来 打开 一 个 目录 ,前 提 是 用 户 对 目录 具有 读 权限 。opendir 函数 接口 
规范 说 明 如 表 3. 20 所 示 。 
表 3.20 opendir 函数 的 接口 规范 说 明 


函数 名 称 opendir 
函数 功能 打开 目录 文件 
Ë include <sys/types. h> 
add # include —dirent. h> 
函数 原型 DIR * opendir(const char * name); 
参数 name: 目录 名 
P DIR * 形态 的 目录 流 : 成 功 
nin NULL: 失败 


说 明 : 
opendir 用 来 打开 参数 name 指定 的 目录 ,并 返回 DIR * 形态 的 目录 流 , 对 目录 的 读 
取 和 搜索 都 要 使 用 此 返回 值 .类 似 于 fopen 函数 的 FILE x sk open 函数 的 fd 文件 描述 


9^. 
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符 。 函 数 执行 成 功 时 将 会 返回 DIR * 形态 的 目录 流 ,失败 则 返回 NULL, 并 将 错误 代码 


FA errno 中 。 
352 读 取 目 录 项 


readdir 用 来 从 参数 dirp 所 指向 的 目录 文件 中 读 取 目 录 项 信息 ,该 函数 返回 一 个 
struct dirent 结构 的 指针 ,这 个 指针 指向 本 次 读 取 的 目录 项 。readdir 函数 接口 规范 说 明 


如 表 3. 21 所 示 。 


表 3.21 readdir 函数 的 接口 规范 说 明 


函数 名 称 readdir 
函数 功能 读 取 目 录 项 信息 
头 文件 * include —dirent. h> 
函数 原型 struct dirent * readdir(DIR * dirp) ; 
参数 dirp: 目录 流 指针 
返回 值 当前 目录 文件 读 写 位 置 所 指 的 目录 项 : 成 功 
NULL; 失败 或 读 到 目录 文件 尾 
说 明 : 
目录 项 信息 用 dirent 结构 体 来 记录 ,该 结构 体 类 型 定义 如 下 : 
struct dirent 
{ 
long d ino; /* inode nmber 索引 结 点 号 * / 
off t d off; /* offset to this dirent 在 目录 文件 中 的 偏 移 / 
unsigned short d reclen; /* length of this d næ 文件 名 长 * / 


unsigned char d type; 


/* the type of d nane 文件 类 型 * / 


char d name [NEME MAX 1]; /* file name (null- terminated) 文件 名 * / 


) 


从 上 述 定义 可 以 看 出 ,dirent 结构 体 存 储 着 文件 的 一 部 分 信息 ,通过 文件 inode 和 文 
件 名 ,dirent 结构 体 可 以 起 到 索引 的 作用 ,在 文件 系统 中 查找 到 文件 的 所 有 信息 。 
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closedir 函数 关闭 一 个 目录 流 并 释放 与 之 关联 的 资源 , 它 在 执行 成 功 时 返回 为 0, 发 
生 错 误 时 返回 为 一 1。closedir 函数 接口 规范 说 明 如 表 3. 22 所 示 。 


表 3.22 closedir 函数 的 接口 规范 说 明 


函数 名 称 closedir 
函数 功能 关闭 目录 

# include — sys/types. h> 
iani * include —dirent. h> 
函数 原型 int closedir(DIR * dirp); 


mos sanee \D/ 
表 


E 
参数 dirp: 目录 流 指针 
0: 成 功 
A pH 一 1: 失败 


示例 程序 3. 10 使 用 opendir, closedir, readdir 和 Istat 函数 显示 指定 目录 下 的 文件 
结构 。 


[示例 程序 3.10 printdir demo.c] 
# include< unistd.h» 

# include< stdio.h> 

# include« dirent.h» 

# include< string.h» 

# include« sys/stat..h» 

# include stdlib.h» 


void printdir(char * dir, int depth) 
1 

DIR * dp; 

struct dirent * entry; 

struct stat statbuf; 


if ( (dp= opendir (dir) )== NULL) 
i 
fprintf (stderr, "cannot open directory :$3Wn",dir); 
retum; 
) 
chdir (dir); 
while((entry- readdir (dp) ) != NULL) 
t 
lstat (entry- >d name, &statbuf) ; 
if(S ISDIR(statbuf.st mode)) 
t 
/* 发 现 目 录 , 但 是 忽略 .和 ..* / 
if(stram(".",entry- >d name)==0||stramp("..",entry- >d name)-- 0) 
continue; 
Printf(" * s&s/An", depth, "",entry- >d name); 
printdir(entry- >d name,depth* 4) ; 
) 
else 
printf("* * s&sVn", depth, "",entry- »d name); 
i 
chdir("."); 
closedir (dp); 
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} 


int main (int argc,char * argv[]) 
{ 
char * topdir="."; 
if (arg>=2) 
topdir- argv[1]; 


printf ("Directory scan of $s\n", topdir) ; 
printdir (topdir, 0); 
printf ("dcne. Wn") ; 


exit (0); 

i 

在 示例 程序 3. 10 中 , main 函数 调用 printdir 函数 显示 指定 目录 下 的 文件 信息 。 
printdir 函数 以 列表 的 形式 逐个 输出 第 一 个 参数 目录 下 的 文件 信息 ,输出 过 程 中 ,如 果 当 
前 处 理 的 文件 为 目录 文件 , 则 递归 调用 printdir 显示 当前 目录 文件 中 的 文件 信息 。 由 于 
Linux 系统 对 于 打开 的 目录 流 数 目 有 限制 ,所 以 如 果 目 录 的 舱 套 层次 太 深 ,程序 将 会 
出 错 。 

printdir 函数 的 第 二 个 参数 用 来 根据 递归 调用 的 层次 控制 显示 文件 信息 时 的 缩 进 ， 
除 此 之 外 ,程序 中 还 增加 了 对 “. ”和 *..” 目 录 的 判断 ,对 这 两 个 目录 不 做 处 理 也 不 输出 。 


3.6 实现 自己 的 1s 命令 


通过 本 章 内 容 的 学 习 , 现 在 读者 已 经 掌握 了 足够 的 知识 来 实现 一 个 自己 的 1s 命令 程 
序 , 该 程序 支持 -1\-a 选项 。 

1. 命令 的 功能 及 用 法 

“ls -1 去 目录 或 文件 之 ”命令 的 功能 是 以 长 格式 形式 列 出 文件 主要 属性 与 权限 等 数据 
或 列 出 目录 下 的 所 有 子 目 录 和 文件 的 主要 属性 与 权限 等 数据 。 

"Is -a 所 目录 二 ”命令 功能 是 显示 目录 下 的 所 有 子 目 录 和 连同 隐藏 文件 在 内 的 全 部 
文件 。 

本 节 内 容 实现 的 1s 命令 使 用 格式 为 : 

1s [-a][-1] [< 路 径 >] 


2. myls. c 程序 流程 

myls. c 程序 主 函 数 main 流程 如 图 3. 10 所 示 。 

main 函数 首先 接收 输入 的 参数 ,判断 格式 是 否 正确 ;随后 判断 是 否 指定 了 要 处 理 的 
目录 或 文件 ,根据 不 同 的 情况 分 别 进行 处 理 。 

3. 主要 函数 说 明 


(1) void print_attribute(struct stat buf. char * name) 
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解析 输入 参数 


Y 
打印 当前 月 录 下 的 文件 信息 打印 参数 中 每 个 月 录 或 文件 信息 


结束 
图 3.10 myls.¢ 程序 主 函 数 main 流程 
函数 功能 : 打印 文件 名 为 name 的 文件 的 信息 。 例 如 : 


-rw-r--r-- lrox rot 70 1 月 815:56 


含义 分 别 为 : 文件 的 类 型 和 访问 权限 ,文件 的 链接 数 、 文 件 所 有 者 ,文件 所 有 者 所 属 
的 组 ,文件 大 小 、 文 件 创建 时 间 。 

(2) void print_single(char * name) 

函数 功能 : 输出 文件 的 文件 名 , 若 命令 中 没有 -1 选项 , 则 输出 文件 名 时 要 保证 上 下 对 
齐 。 例 如 : 


bin orm etc — initrd.img lib ^ lostkfoud mt proc nn srv 

boot dev hme initrd.img.old 1lib64 media cpt root sbin sys 

(3) void print(int flag. char * pathname) 

函数 功能 : 根据 命令 行 参数 flag 和 完整 的 路 径 名 pathname 显示 目标 文件 。 

参数 flag 可 以 取 以 下 值 或 者 它们 “1” 操 作 之 后 的 组 合 ,具体 取 值 如 下 所 示 。 

。 PARAM_NONE: 没有 选项 。 

。 PARAM_A: 带 -a 选项 ,表示 显示 该 目录 下 的 所 有 文件 ,包括 隐藏 文件 。 

。 PARAM_L: 带 -] 选项 ,表示 显示 文件 的 详细 信息 ,包括 文件 的 类 型 和 访问 权限 、 

文件 的 链接 数 .文件 所 有 者 .文件 所 有 者 所 属 的 组 ,文件 大 小 \ 文 件 创建 时 间 。 

(4) void print dir(int flag param, char * path) 

函数 功能 : 为 显示 某 个 目录 下 的 文件 做 准备 ,参数 flag param 用 于 在 调用 print 函数 
时 作为 其 参数 flag 的 实 参 ,path 是 要 显示 的 目录 。 

函数 流程 : 

。 获取 该 目录 下 文件 的 总 数 和 最 长 的 文件 名 。 

。 获取 该 目录 下 所 有 文件 的 文件 名 ,存放 在 变量 filenames 中 。 

t 按 文件 名 进行 字母 排序 ,排序 后 文件 名 按 字母 顺序 存储 于 filenames 中 。 

。 调用 print(int flag. char * pathname) 函 数 显示 每 个 文件 的 信息 。 


(5) void my_err(const char * err string. int line) 
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函数 功能 : 输出 运行 中 出 现 的 错误 所 在 的 行 号 和 错误 信息 。 
4. 部 分 源 代码 


# define PARM NONE 0 // 无 参数 

# define PARAM A 1 //-a: 显示 所 有 文件 

# define PARM L 2 //-1: 一 行 只 显示 一 个 文件 的 详细 信息 
# define MEXRORLINE 80 /一 行 显示 的 最 多 字符 数 


int g leave len- MAXEOWLINE; // 一 行 剩余 长 度 , 用 于 输出 文件 
int g mexlen; /存放 某 目录 下 最 长 文件 名 的 长 度 


/* 错误 处 理 函数 ,打印 出 错 所 在 行 的 行 号 和 错误 信息 * / 
Void my err(const char * err string, int line) 
t 
// 读 者 请 自行 补充 
} 


/* 获取 文件 属性 并 打印 * / 

void print attribute (struct stat buf, har * name) 

t 
char buf time[32]; 
struct passwd * ped; // 从 该 结构 体 中 获取 文件 所 有 者 的 用 户 名 
struct group * grp; // 从 该 结构 体 中 获取 文件 所 有 者 所 属 组 的 组 名 


/* 获取 并 打印 文件 类 型 * / 


if (S_ISINK(buf.st_mode)) printf ("1"); 
else if(S ISREG(buf.st mode)) print£("- "); 
else if(S ISDIR(buf.st mode)) printf ("d"); 
else if(S ISCHR(buf.st mode)) printf ("d"); 
else if(S ISBIK (buf.st mode) printf ("b"); 
else if (S_ISFIFO (buf.st mode)) printf ("£"); 
else if(S ISSOCK(buf.st mode)) printf ("s"); 


/* 获取 并 打印 文件 所 有 者 的 权限 * / 
if(buf.st mode & S IRUSR) 
printf ("r"); 
else 
printf ("- "); 
if(buf.st mode & S IWUSR) 
printf ("w"); 
else 
printf ("-"); 
if(buf.st mode & S IXUSR) 
printf ("x"); 
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else 
print£(- "); 


/* 获取 并 打印 与 文件 所 有 者 同 组 的 用 户 对 该 文件 的 操作 权限 * / 
if(puf.st mode & S IRGRP) 
printf ("r"); 
else 
printf ("- "); 
if(buf.st mode & S IWGRP) 
printf ("w"); 
else 
printf ("- "); 
if(buf.st mode & S IXGRP) 
printf ("x") ; 
else 
printf ("- "); 


/* 获取 并 打印 其 他 用 户 对 该 文件 的 操作 权限 * / 
if(buf.st mode & S IROTH) 
printf ("r"); 
else 
printf ("- "); 
if(buf.st mode & S IWOTH) 
printf ("w"); 
else 
printf ("- "); 
if(buf.st mode & S IXOTH) 
printf ("x"); 
else 
printf ("- "); 


printe  "); 


/* 根据 uia fll gid 获取 文件 所 有 者 的 用 户 名 和 组 名 * / 
psd-getpwuid(buf.st uid); 
grp-getgrgid(buf.st uid); 
printf("$4d ",buf.st nlink); // 打 印 文件 的 链接 数 
printf ("&- ss",psd- »pw name); 
printf ("%- 8s",grp- > gr name); 


print£("$63",buf.st size); // 打 印 文件 的 大 小 
stropy (buf time,ctime (sbuf.st mtime)); 
buf time[strlen(buf time)- 1]- "VO'; // 去 掉 换 行 符 


printf (" $s",buf time); // 打 印 文件 的 时 间 信 息 
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j 


/* 在 没有 使 用 -1 选项 时 ,打印 一 个 文件 名 ,打印 时 上 下 行 对齐 * / 
void print single(char * name) 
{ 

// 读 者 请 自行 补充 


/* 根据 命令 行 参数 和 完整 路 径 名 显示 目标 文件 , flag 为 命令 行 参 数 ,pathname 包含 文件 名 的 路 径 
名 */ 
void print (int flag, char * Pathname) 
{ 
int i,j; 
struct stat buf; 
char name[NAME MAX* 1]; 


/* 从 路 径 中 解析 出 文件 名 * / 
for(i= 0,j= 0; i< strlen (pathname) ;i* * ) 
{ 
if(pathrene[i]-- '/*) 
{ 
jo 
continue; 
) 
name[j* + ]- pathnare [i]; 
) 


name[j]- '\0'; 


/* 用 lstat 而 不 是 stat 以 方便 解析 链接 文件 * / 
if(lstat (pathname, &buf)- — - 1) 
t 

my err("stat", LINE ); 


switch (flag) 
t 
case PARAM NONE: // 没 有 -1 和 -a 选 项 
if(name[0]!- '.") 
print single(name); 
break; 
case PARM A: //-a: 显 示 包 括 隐藏 文件 在 内 的 所 有 文件 
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case PARM L: //-1: 每 个 文件 单独 占 一 行 ,显示 文件 的 详细 属性 信息 
print attribute (buf,name) ; 
printf (" $- s Wn", name); 
break; 


case PARAM At PARAM L: // 同 时 有 -a 和 -1 选项 的 情况 
print attribute (buf,name); 
printf (" $- sVn",name) ; 
break; 


default:break; 
) 


/* 为 显示 某 个 目录 下 的 文件 做 准备 ,参数 flag Paran 用 于 在 调用 print 函数 时 作为 其 参数 flag 的 
实 参 ,Path 是 要 显示 的 目录 * / 
void print dir(int flag param, char * path) 
{ 
DIR * dir; 
struct dirent * ptr; 
int count- 0; 
char filenames [256] [FATH MAX+ 1], temp[PATH MAX* 1]; 


/获取 该 目录 下 文件 总 数 和 最 长 的 文件 名 
/获取 该 目录 下 所 有 的 文件 名 


// 对 文件 名 进行 排序 ,排序 后 文件 名 按 字母 顺序 存储 于 filenames 


for (i7 0;i< count;i* +) 
print (flag param, filenames[i]); 


// 如 果 命 令 行 中 没有 -1 选项 ,打印 一 个 换行 符 


int main (int argc, char **argv) 
t 
// 读 者 请 自行 补充 ,参考 图 3.10 流 程 编 写 


3.7 小 结 


本 章 学 习 了 Linux 中 文件 系统 相关 概念 ,主要 从 内 核 态 的 角度 理解 虚拟 文件 系统 、 目 
录 、 索 引 结 点 ,文件 描述 符 和 文件 访问 权限 。 在 理解 Linux 内 核对 文件 组 织 和 管理 的 一 些 
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基础 概念 后 ,重点 介绍 了 如 何 使 用 系统 IO 接口 完成 文件 的 读 / 写 操作 ,文件 属性 操作 和 
文件 目录 操作 ,系统 1/O 接口 很 多 ,这 里 介绍 了 一 些 常 用 的 系统 调用 接口 。Linux 还 为 编 
程 人 员 提 供 了 标准 L/O 接口 。 本 章 介 绍 了 这 两 类 接口 的 本 质 区 别 和 关系 ,并 介绍 了 不 带 
缓冲 区 1/O 操作 和 带 缓冲 区 的 L/O 操作 原理 ,以 及 不 带 缓冲 区 1/O 操作 中 的 文件 描述 符 
fd 和 带 缓冲 区 的 1/0 操作 中 的 FILE 流 概念 。 最 后 在 3.6 节 , 应 用 本 章 前 面 介绍 的 知识 ， 
自己 设计 完成 一 个 支持 -1 和 -a 参数 的 ls 命令 。 


习 题 
一 、 填 空 题 
1. 在 Linux 中 ,所 有 设备 和 磁盘 文件 的 打开 操作 都 可 使 用 系统 调用 来 
进行 。 

2. 调用 函数 可 以 创建 一 个 文件 ,调用 函数 可 以 获取 文件 的 属性 。 

3. 在 Linux 中 ,文件 的 权限 分 为 和 三 类 ,每 类 分 为 
和 权限 。 

4. 读 取 一 个 目录 文件 的 内 容 时 ,可 使 用 系统 调用 。 

5. 若 fle 文 件 存 取 权 限 为 r-xr-r--' 这 表明 属 主 有 权限 ,组 用 户 有 
权限 ,其 他 用 户 有 权限 。 

二 、 简 答题 


1. 说 明 系 统 L/O 和 标准 L/O 的 区 别 ? 并 说 明 它们 的 适用 场合 。 

2. 什么 是 文件 描述 符 ? 什么 是 流 ? 二 者 有 什么 区 别 和 联系 ? 

三 、 编程 题 

1. 用 creat open, close 等 系统 调用 ,实现 fopen, fclose 的 功能 。 

2. 设计 一 个 程序 ,要 求 打开 文件 “pass”, 如 果 没 有 这 个 文件 ,新 建 此 文件 ; 读 取 系统 
文件 “etc/passwd”, 把 文件 中 的 内 容 都 写 入 “pass” 文 件 。 

3. 在 示例 程序 3. 8 的 基础 上 完善 chmod 命令 ,使 之 支持 如 u 十 x,g-w,o-w 等 功能 。 

4. 设计 一 个 程序 ,要 求 新 建 一 个 目录 , 预 设 权 限 为 -x 一 x 一 x。 

5. 使 用 fcntl 函数 的 文件 记录 锁 功 能 ,实现 多 个 进程 对 同一 文件 进行 读 或 写 的 共享 
操作 。 

6. 根据 3.6 节 介绍 的 内 容 , 补 充 myls. c 源码 ,实现 3.6 节 要 求 的 1s 命令 。 
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进程 管理 


进程 是 操作 系统 中 的 一 个 核心 概念 , 它 是 CPU 调度 的 基本 单位 ,可 以 说 ,整个 操作 
系统 的 工作 都 是 围绕 着 进程 开展 的 。 深 入 理解 和 掌握 Linux 的 进程 结构 及 组 织 方式 ,对 
于 学 习 Linux 操作 系统 及 Linux 环境 编程 具有 非常 重要 的 意义 。 

进程 与 程序 不 同 , 却 又 与 程序 有 着 密切 的 联系 。 程 序 是 一 个 静态 的 指令 集合 ,以 文件 
的 形式 保存 于 计算 机 系统 的 外 存 中 ,静态 的 程序 并 不 会 占用 计算 机 系统 的 运行 资源 ,例如 
内 存 、 寄 存 器 .CPU 等 。 而 进程 是 一 个 动态 的 概念 , 它 由 程序 产生 ,是 程序 ,数据 和 进程 控 
制 块 (PCB) 的 集合 ,或 者 可 以 说 ,进程 是 程序 的 一 次 执行 过 程 。 一 个 程序 的 多 次 执行 过 程 
就 对 应 了 多 个 进程 ,Linux 是 一 个 多 用 户 多 任务 操作 系统 ,因此 在 Linux 操作 系统 上 可 同 
时 运行 多 个 进程 。 

本 章 就 来 学 习 程 序 和 进程 之 间 的 关系 ,以 及 关于 进程 的 知识 。 


4.1 Linux 可 执行 程序 的 存储 结构 与 进程 结构 
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在 Linux 系统 中 ,可 执行 文件 的 格式 为 ELF, 即 Executable and Linking Format。 可 
以 使 用 file 或 readelf 命令 来 查看 文件 的 情况 ,下 面 用 一 个 示例 来 说 明 。 

首先 在 当前 目录 下 建立 一 个 C 语言 源 程序 文件 exl.c, 内 容 如 下 : 

[示例 程序 4.1 exl.c] 

# include< stdio.h» 

int glcb a,glcb b-10; 

int main () 

i 


static int local val; 
inti; 
printf ("glob a- $d,gldb br &dWnlocal val- &d,i- &dWn",glcb a, 
glcb b, local val,i); 
) 


将 这 个 文件 编译 为 exl ,使 用 file 命令 查看 ,运行 结果 如 下 : 


root&ubuntu:^ # goc exl.c - o exl 
root&ubuntu: # file exl 
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exl: ELF 32- bit LSB executable, Intel 80386, version 1 (SYSV), dynamically linked (uses shared libs), for 

GNU/Linux 2.6.32, BuildID[shal]- 5a2708068ec32dbeSace4dBleelafefededbdéa4, not stripped 

从 结果 中 可 以 看 到 ,exl 文件 类 型 为 32 位 ELF 可 执行 文件 。 

在 ELF 类 型 的 可 执行 文件 中 ,程序 代码 数据 是 分 开 存放 的 ,因此 ,可 执行 文件 的 内 
部 被 划分 为 若干 区 域 ,这 些 区 域 称 为 可 执行 文件 的 段 (section)。 可 以 使 用 size 命令 来 查 
看 可 执行 文件 中 各 段 的 大 小 。 以 下 是 查看 exl 文件 的 结果 : 


rootGubuntu:^ # size exl 
text data bss dec hex filename 
a5 204 40 1159 487 exu 


结果 显示 exl 文件 总 大 小 为 1159 字 节 ,其 中 text 段 是 915 字 节 ,data 段 204 FW, 
bss Bt 40 字 节 ,hex 是 文件 大 小 的 十 六 进 制 表示 。 

从 结果 中 可 以 看 出 ,在 Linux 操作 系统 中 ,一 个 可 执行 文件 的 BSS 
结构 如 图 4. 1 Bros , 它 由 三 个 段 组 成 ,分 别 是 : 数据 自 

CD 代码 段 (text): 存放 程序 的 二 进 制 代码 ,这 些 二 进 制 代 码 
是 CPU 唯一 能 执行 的 机 器 指令 。 代 码 段 通常 是 只 读 的 ,因为 修改 
代码 是 通过 修改 程序 源 文件 实现 ,在 运行 时 代码 是 不 会 被 修改 的 ， 
因此 将 代码 段 设 置 为 只 读 ,以 防止 其 机 器 指令 被 其 他 程序 修改 。 图 4.1 可 执行 程序 
由 于 代码 段 是 只 读 的 ,那么 就 可 以 将 其 设置 为 共享 的 。 这 样 ,对 于 的 结构 
频繁 被 执行 的 程序 ,就 可 以 只 保留 一 份 代码 。 并 且 当 其 他 的 可 执 
行程 序 需要 调用 该 程序 时 ,也 可 以 读 取 这 份 代码 ,不 需要 在 内 存 中 存储 两 份 同样 的 代码 ， 
只 需要 在 内 存 中 有 一 份 代码 即 可 。 除 了 机 器 代码 外 ,代码 段 还 规划 了 局 部 变量 的 相关 
信息 。 

代码 段 的 机 器 指令 包括 操作 码 和 操作 对 象 (或 对 象 地 址 引用 )。 如 果 操 作对 象 是 立即 
数 ( 即 具体 的 数值 ) ,那么 可 以 直接 将 立即 数 包含 在 代码 中 。 如 果 是 局 部 数据 ,那么 在 运行 
局 部 数据 所 在 的 函数 时 ,系统 将 给 这 些 局 部 变量 在 栈 区 分 配 空间 。 代 码 中 使 用 该 局 部 数 
据 时 ,通过 引用 局 部 数据 地 址 的 方式 读 写 数据 。 

(2) 全 局 初始 化 数据 区 /静态 数据 区 (data) : 通常 称 为 数据 段 , 用 来 存储 在 程序 中 明 
确 被 初始 化 的 全 局 变量 .已 经 初始 化 的 静态 变量 (包括 全 局 静态 变量 和 局 部 静态 变量 ) 和 
常量 数据 (如 字符 串 常量 ) ,属于 静态 内 存 分 配 区 。 

CD 未 初始 化 数据 区 (bss) : 通常 称 为 BSS 段 ,保存 的 是 全 局 未 初始 化 变量 和 未 初始 
化 静态 变量 ,其 值 为 0 或 者 空 值 。 实 际 上 尽管 BSS 段 显 示 了 占用 空间 的 大 小 ,但 在 程序 
文件 中 却 并 未 给 其 中 的 变量 分 配 空间 ,只 是 占用 一 部 分 空间 来 记录 未 初始 化 的 变量 的 大 
小 、 属 性 等 信息 。 将 其 加 载 到 进程 中 时 ,操作 系统 会 根据 BSS 段 记录 的 情况 为 变量 在 内 
存 中 分 配 空间 ,并 将 其 中 所 有 的 数据 初始 化 为 0 或 空 值 。 

当 程序 代码 要 使 用 数据 段 或 BSS 段 的 变量 时 ,可 以 像 局 部 变量 一 样 引用 该 数据 的 
地 址 。 


代码 段 
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进程 来 源 于 程序 ,是 程序 的 一 次 执行 过 程 。 当 可 执行 程序 被 运行 时 ,操作 系统 将 可 执 
行程 序 读 入 内 存 , 依 据 程 序 的 内 容 创 建 一 个 进程 。 在 Linux 环境 下 ,可 以 使 用 ps 命令 来 
查看 进程 的 情况 ,以 下 是 ps 命令 的 运行 结果 。 


root@ubuntu:~ # ps 


PID USR OMAND 
1 root {init} /bin/sh /sbin/init 
2 root [kthreadd] 
3 root [kworker/0:0] 
4 root [kworker/0:0H] 
5 root [kworker/u2:0] 


6 root [rm percpu wg] 
7 root [ksoftirgd/0] 
8 root [kdevtmpfs] 

9 root [oom reaper] 
10 root [writeback] 
11 root [kcampactdo] 
12 root crypto] 

13 root [bioset] 
14 root Xblockd] 

15 root. [kworker/0:1] 
16 root [kswapd0] 

17 root [bioset] 


34 root [khvod] 

35 root [bioset] 
36 root [bioset] 
37 root [bioset] 
38 root [bioset] 
39 root [bioset] 


56 root vflogin - P hrtest 
57 hrtest  vflogin -P hrtest 
Glhrtest  vfagent -p 
75 hrtest  /bin/sh- 1 
93 root [kworker/u2:1] 
125 hrtest ps 
从 以 上 结果 可 以 看 到 ,ps 命令 列 出 了 当前 系统 中 的 一 些 进程 。 从 表 头 信息 可 以 看 出 
第 一 列 为 PID 号 , 即 process IDentity , 称 为 进程 的 ID 号 或 进程 号 ,每 个 进程 都 由 一 个 唯 
一 的 进程 号 标识 。 在 Linux 系统 中 ,进程 号 是 一 个 非 负 整数 。 第 二 列 为 USER, 即 创建 这 
个 进程 的 用 户 。 第 三 列 COMMAND 即 与 该 进程 对 应 的 可 执行 程序 名 称 。 
从 上 述 的 运行 结果 可 以 看 出 ,在 Linux 这 个 多 任务 系统 中 ,在 某 一 时 刻 同时 有 多 个 进 
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程 在 运行 。 每 个 进程 有 自己 的 独立 内 存 空 间 , 根 据 权限 对 允许 的 内 存 进行 读 写 , 互 不 打 
扰 。 每 个 进程 都 是 独立 的 ,只 在 必要 的 时 候 使 用 不 同 的 通信 方式 传递 信息 。 内 核 通过 分 
时 调度 的 方法 调度 各 个 进程 运行 。 

再 来 将 焦点 聚集 在 单个 进程 上 ,从 结构 上 来 看 ,可 以 把 一 个 进程 分 为 5 个 部 分 : 代码 
区 .数据 区 、BSS 区 、 堆 区 和 栈 区 。 由 于 这 5 个 区 的 用 途 不 同 ,进程 对 这 5 个 部 分 的 管理 方 
式 也 不 同 。 

CD 代码 区 : 用 来 存放 进程 执行 的 代码 ,这 部 分 区 域 的 大 小 在 程序 运行 前 就 已 经 确 


ET. 
(2) 数据 区 : 用 来 存放 已 初始 化 的 全 局 变量 和 静态 变量 ,这 部 分 区 域 的 大 小 在 程序 
运行 前 就 可 以 确定 。 

G) BSS IX : 用 来 存放 未 初始 化 的 全 局 变量 和 静态 变量 ,这 部 分 区 域 的 大 小 也 是 在 
程序 运行 前 就 可 以 确定 的 。 

以 上 三 个 区 使 用 静态 内 存 分 配 的 方式 ,其 内 容 来 源 于 与 进程 对 应 的 可 执行 程序 ,由 加 
EX SEM 

(4) HER Cheap): 即 进程 运行 过 程 中 可 被 动态 分 配 的 内 存 段 ,大 小 不 固定 ,可 动态 扩 
张 或 缩减 。 程 序 中 使 用 malloc 等 函数 动态 分 配 的 内 存 就 属于 堆 区 ,不 使 用 时 需要 调用 
free 函数 将 该 内 存 释放 。 

(5) RRE (stack): 栈 区 内 存 由 操作 系统 自动 分 配 , 用 于 存放 进程 中 临时 创建 的 局 部 
变量 .函数 调用 时 的 参数 .返回 值 等 , 当 函 数 调用 结束 时 ,释放 相关 内 存 。 

可 执行 文件 各 段 和 进程 结构 之 间 的 关系 如 图 4. 2 所 示 。 


进程 


可 执行 程序 


BSS 段 — BSS| 


P» 


数据 段 一 ”| 数据 


pa 


代码 段 一 ~ 代码 


54 


图 4.2 Linux 系统 中 的 进程 结构 示意 图 
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在 Linux 系统 中 , 除 第 一 个 进程 是 “手工 ”建立 以 外 ,其 余 进程 都 是 使 用 系统 调用 
fork 创建 的 ,被 创建 的 进程 称 为 子 进程 (child process), 调 用 fork 的 进程 称 为 父 进程 
(parent process) 。 内 核 程序 使 用 进程 ID 号 标识 每 一 个 进程 。 一 个 进程 除了 有 一 个 PID 
属性 存储 进程 ID 号 之 外 ,还 会 有 一 个 PPID(parent PID) 属 性 来 存储 父 进程 的 PID, 
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在 用 户 态 下 ,从 某 个 进程 出 发 , 沿 着 PPID 不 断 向 上 追溯 ,总 会 发 现 其 源头 是 init 进 
程 ,所 有 的 用 户 进程 就 构成 了 一 个 以 init 进程 为 根 的 树 状 结构 ,这 棵 树 中 的 任 一 进程 都 是 
init 进程 的 子孙 。 在 Shell 环境 下 ,可 以 使 用 pstree 命令 来 查看 进程 树 的 结构 ,例如 以 下 
pstree 命令 的 结果 就 是 用 户 root 所 处 环境 的 进程 树 结构 。 


root@ubuntu:~ # pstree 
init 下 一 console kit- dae——— 63* [(console- kit- da}] 
上 一 ceena 


上 一 rayslogd 一 一 一 3* [{rsyslogd}] 

上 一 sshd 一 下 一 sshd sshd bash 

| 上 一 sshd sshd bash pstree 
上 一 udevd 一 一 一 2# [udevd] 


进程 树 是 一 种 表示 进程 关系 的 方法 ,从 进程 树 中 可 以 很 清晰 地 观察 到 进程 之 间 的 亲 
缘 关 系 。 


4.2 进程 的 环境 和 进程 属性 
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进程 在 运行 的 过 程 中 ,常会 使 用 创建 进程 时 所 设置 的 命令 行 参 数 。 

当 在 终端 中 键入 命令 cp file a file b 并 运行 后 ,实际 上 系统 是 在 运行 cp 命令 对 应 的 
可 执行 程序 /bin/cp, 并 且 在 本 次 执行 时 有 两 个 参数 : file_a file_b, 这 两 个 参数 就 是 命令 
行 参数 ,要 实现 将 file_a 的 内 容 复制 给 file_b, 就 要 求 与 此 命令 对 应 的 cp 程序 使 用 带 参数 
的 主 函 数 方式 编写 。 

在 Linux 中 ,大 多 数 命 令 对 应 的 程序 由 C 语言 编写 实现 ,因此 程序 代码 从 main 函数 
开始 执行 , 当 命令 行 中 出 现 参 数 时 ,就 要 求 main 函数 能 够 接收 这 些 参 数 。 在 Linux 中 , 带 
参数 的 主 函 数 原型 为 : 


int main(int argc, char * argv[], char * emwp[]); 或 

int main(int argc, char * argv[]); 
其 中 ,argc 表示 命令 行 参数 的 个 数 ,argv 是 指向 每 个 参数 的 指针 所 组 成 的 数组 。 以 命令 
cp file a file b 为 例 ,如 图 4. 3 所 示 , 当 Linux 执行 该 命令 时 , 主 函 数 获得 参数 ,argc 值 为 
3, 即 该 命令 行 有 三 个 参数 ,分 别 是 cp、file_a、file_b;argv 数组 此 时 有 4 个 指针 ,第 一 个 指 
向 cp, 第 二 个 指向 fle_a, 第 三 个 指向 file_b, 第 四 个 指针 为 NULL ,表示 指针 数组 结束 。 
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命令 行 中 未 设置 环境 变量 ,本 次 命令 执行 时 ,将 会 使 用 默认 的 环境 变量 值 。 

参数 envp 记录 了 程序 运行 时 的 环境 变量 。 环 境 变 量 environ 是 一 个 全 局 变量 ,存在 
于 所 有 的 Shell 中 ,在 登录 系统 的 时 候 就 已 经 有 了 相应 的 系统 定义 的 环境 变量 。Linux 的 
环境 变量 具有 继承 性 , 即 子 进程 会 继承 父 进程 的 环境 变量 。 环 境 变量 是 一 个 指针 数组 , 记 
录 了 很 多 与 程序 运行 有 关 的 系统 数据 ,例如 ,默认 的 路 径 、Shell 类 型 等 。 图 4. 4 所 示 为 具 
有 3 个 环境 参数 的 环境 变量 。 


argc=3 argv environ 
一 二 一 “cp” - 一 HOME-"/home/hr" 
— “file a" — PATH=.” 
一 一 让 一 USER=hr” 
NULL NULL 
图 4.3 命令 行 参数 的 结构 图 4.4 Shell 的 环境 变量 environ 


在 Shell 环境 中 ,可 以 通过 全 局 变量 environ 来 获取 变量 值 ,或 通过 命令 env set 来 查 
看 当前 环境 变量 的 值 ,在 C 源 程序 中 ,可 以 使 用 getenv 函数 来 获取 指定 的 环境 变量 的 值 。 
getenv 函数 接口 规范 说 明 如 表 4. 1 所 示 。 


表 4.1 getenv 函数 的 接口 规范 说 明 


函数 名 称 getenv 

函数 功能 获取 当前 某 个 环境 变量 的 值 

头 文件 * include stdlib. h> 

函数 原型 char * getenv(const char * name); 
参数 name: 环境 变量 的 名 称 

sna Jug 


例如 ,下 面 的 代码 用 于 获取 当前 所 使 用 的 PATH fü 

char* s; 

s= getenv ("PATH") ; 

当 执 行 main 函数 的 实 参 只 有 arge 和 argv 时 ,表示 使 用 默认 的 环境 变量 来 执行 
程序 。 
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进程 是 一 个 动态 存在 的 个 体 , 它 的 存在 需要 CPU 及 各 种 计算 机 系统 资源 的 协助 , 因 
此 , 当 有 多 个 进程 需要 运行 而 系统 资源 又 不 足以 使 其 同时 运行 时 ,对 进程 就 会 产生 影响 ， 
需要 对 进程 调度 ,CPU 调度 进程 的 阶段 不 同 也 就 产生 了 不 同 的 进程 状态 。 

从 操作 系统 的 理论 上 来 说 ,多 任务 操作 系统 中 的 进程 在 任 一 时 刻 都 会 处 于 运行 .就 


mam Wem e^. 


绪 、 阻 塞 这 三 种 状态 中 的 一 种 , 随 着 资源 被 剥夺 或 重新 拥有 资源 ,这 三 种 状态 可 以 转换 , 具 
体 转换 规则 如 图 4. 5 所 示 。 

从 图 中 可 以 看 到 ,进程 存在 着 4 种 状态 之 间 
的 转换 : 

COD 就 绪 态 一 运行 态 : 处 于 就 绪 态 的 进程 拥 
有 除 CPU 以 外 的 所 有 资源 , 当 本 次 CPU 调度 到 
该 进程 时 ,将 该 进程 读 和 人 CPU JE GERE [uen AE gg 
dace Has 操作 系统 中 进程 的 状态 转换 图 

(2) 运行 态 一 就 绪 态 : 正在 CPU 中 运行 的 
进程 由 于 时 间 片 用 尽 .CPU 被 抢占 等 原因 失去 
了 CPU, 但 仍 拥有 运行 所 需要 的 其 他 资源 ,此 时 该 进程 就 从 运行 态 转变 为 就 绪 态 。 

(3) 运行 态 习 阻塞 态 : 处 于 运行 态 的 进程 由 于 需要 某 些 资源 ,而 这 些 资 源 又 无 法 立 
即 响 应 进程 的 需求 ,导致 进程 即使 拥有 了 CPU 也 无 法 运行 ,例如 某 进 程 需要 使 用 打印 
机 ,但 打印 机 正在 执行 其 他 的 打印 任务 。 此 时 只 能 将 该 进程 调 出 CPU, 放 入 阻塞 队列 ,等 
待 进程 的 需求 被 满足 才能 继续 执行 。 

(4) 阻塞 态 一 就 绪 态 : 处 于 阻塞 态 的 进程 获取 到 了 等 待 的 资源 ,此 时 系统 会 将 满足 
运行 条 件 的 进程 统一 放 入 就 绪 队 列 中 ,等 待 CPU 调度 。 

理论 上 来 说 ,在 所 有 的 操作 系统 中 ,进程 状态 转换 都 遵循 以 上 的 几 条 规则 。 具 体 到 
Linux 系统 中 时 ,进程 状态 被 扩充 为 以 下 几 种 : 

(1) 可 运行 态 (TASK_RUNNING): 表示 进程 正在 运行 或 者 正在 等 待 被 运行 ,这 种 
状态 是 将 理论 上 的 运行 态 和 就 绪 态 统一 为 一 种 状态 。 当 计算 机 系统 为 单 核 系统 时 ,只 存 
在 一 条 就 绪 队 列 ,在 CPU 中 运行 的 那个 进程 状态 即 为 运行 态 ,而 其 他 处 于 可 运行 态 队 列 
中 的 进程 状态 为 理论 上 的 就 绪 态 。 即 使 是 多 核 系统 ,每 一 个 进程 也 只 可 能 排列 在 其 中 一 
个 CPU 的 可 运行 态 队 列 中 。 因 此 对 于 任意 一 个 CPU 来 说 ,除了 正在 其 中 运行 的 进程 为 
运行 态 之 外 ,其 他 的 可 运行 态 进程 均 为 理论 上 的 就 绪 态 。 

(2) 可 中 断 的 阻塞 态 (TASK_INTERRUPTIBLE): 此 类 进程 正在 等 待 某 个 事件 完 
成 ,才能 继续 运行 , 即 理论 上 的 阻塞 态 。 通 常 等 待 同一 事件 的 进程 被 安排 成 一 个 阻塞 队 
列 , 处 于 该 状态 的 进程 属于 “ 轻 度 睡眠 ”, 除 了 等 待 的 事件 发 生 可 以 将 该 阻塞 队列 中 的 一 个 
或 多 个 进程 唤醒 外 ,这 些 进程 也 可 以 被 信号 或 者 定时 器 唤醒 。 

G) 不 可 中 断 的 阻塞 态 (TASK_UNINTERRUPTIBLE): 也 是 一 种 阻塞 状态 ,只 不 
过 处 于 该 状态 的 进程 处 于 “深度 睡眠 ”, 它 不 能 被 信号 或 者 定时 器 唤醒 ,只 能 等 待 事件 发 生 
才能 被 唤醒 ,因此 这 类 进程 不 会 被 kill -9 命令 杀 死 

之 所 以 一 些 进 程 会 处 于 不 可 中 断 阻塞 态 , 是 因为 在 菜 此 情况 下 进程 的 处 更 流程 是 不 
能 被 打 断 的 。 如 果 这 类 进程 在 运行 时 被 异步 信号 中 断 , 进 程 的 执行 流程 将 会 被 信号 处 理 
函数 插入 ,从 而 中 断 原先 的 流程 ,导致 进程 运行 出 错 。 所 以 对 这 些 进程 要 保证 其 不 受信 号 
打扰 。vfork 函数 就 是 最 常见 的 导致 进程 转换 为 不 可 中 断 阻塞 态 的 函数 操作 ,在 调用 
vfork 后 , 父 进程 将 会 进入 不 可 中 断 阻塞 态 直 到 子 进程 让 出 运行 空间 。 

(4) 伪 死 状态 (TASK_ZOMBIE) : 进程 已 经 终止 ,释放 了 几乎 所 有 的 内 存 空 间 , 伪 死 
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状态 的 进程 不 能 被 CPU 调度 。 这 类 进程 仅仅 保留 了 一 个 task_struct 数据 结构 (以 及 少 
数 资源 ) ,等 待 父 进程 调用 wait 函数 读 取 该 进程 的 终止 数据 后 才能 释放 。 此 时 ,进程 无 法 
被 kill 命令 杀 死 ,也 不 会 响应 信号 。 尽 管 僵 死 进程 已 释放 了 进程 空间 ,但 它 仍然 占用 了 进 
程 号 这 一 资源 ,所 以 在 进程 结束 后 ,要 尽快 释放 进程 的 task_struct 结构 ,避免 大 量 的 僵 死 
进程 导致 系统 无 进程 号 可 用 。 

C) 跟踪 状态 (TASK_TRACED) : 当 程 序 处 于 调试 状态 时 ,由 于 设置 断 点 或 单 步 执 
行将 使 进程 进入 跟踪 状态 ,只 有 执行 调试 中 的 运行 命令 才能 改变 这 一 状态 。 

(6) 停止 状态 (TASK_STOPPED): 停止 状态 的 进程 处 于 暂停 的 状态 ,这 一 状态 的 进 
程 可 以 被 信号 唤醒 。 向 指定 进程 发 送 SIG_STP 信和 号 ,将 会 使 该 进程 进入 停止 状态 。 跟 踪 
状态 与 停止 状态 相 类 似 ,只 不 过 ,对 进程 发 送信 号 的 是 调试 软件 。 

上 面 所 讲 到 的 进程 状态 在 Linux 系统 中 都 用 宏 来 表示 ,这 些 宏 的 定义 位 于 头 文件 
include/linux/sched. h 中 ,各 状态 宏 定 义 如 下 : 


# define TASK RUNNING 0 // 就 绪 
# define TASK INIEFRUPTIBLE 1 // 中 断 等 待 
# define TASK UNINTERFUPTIHLE 2 // 不 可 中 断 等 待 
# define TASK STOPPED 4 /人 停止 
# define TASK TRACED 8 // 停 止 
# define TASK ZOMBIE 16 //ARSE 
用 户 态 进 程 的 各 状态 之 间 根 据 不 同 的 事件 发 生 可 以 相互 转换 ,其 状态 转换 关系 如 
图 4.6 所 示 。 
| 
一 | m 
事件 发 生 TASK_RUNNING 事件 发 生 
信号 中 断 
调 | ”时 间 
E| 片 用 尽 


阻塞 
调试 程序 | TASK UNINTERRUPTIBLE 1 TASK_INTERRUPTIBLE 


收 到 信号 二 二 
SIG CONT to ë 运行 


等 待 事 人 TASK_RUNNING | 等 待 事件 


跟踪 /停止 
TASK_TRACED/ ~ - 
TASK STOPPED | 调试 程序 进程 退出 | TASK ZOMBIE 
收 到 信号 
SIG_STP 


图 4.6 Linux 系统 中 进程 状态 的 转换 


Linux 系统 中 众多 的 进程 ,由 于 获得 资源 或 资源 被 剥夺 ,不 断 地 在 不 同 的 状态 之 间 切 
换 。 处 于 就 绪 态 的 进程 在 被 CPU 调度 后 开始 执行 ,在 执行 过 程 中 遇 到 需要 等 待 某 些 事件 发 
生 后 才能 继续 执行 的 情况 时 ,如 果 等 待 事件 发 生 的 过 程 中 进程 不 允许 被 中 断 , 则 进程 进入 不 
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可 唤醒 阻塞 态 ,否则 进入 可 唤醒 阻塞 态 。 当 等 待 的 事件 发 生 后 ,阻塞 态 的 进程 将 会 转 为 就 绪 
态 ,可 唤醒 阻塞 态 进 程 也 可 以 被 信号 或 定时 器 唤醒 。 如 果 是 调试 程序 或 进程 在 运行 过 程 中 
收 到 SIG_STP 信号 ,进程 将 进入 跟踪 状态 或 停止 状态 , 当 收 到 调试 信号 或 SIG. CONT 信号 
时 ,进程 重新 转 为 就 绪 态 。 当 进程 执行 了 exit 等 退出 的 函数 后 ,进程 将 进入 僵 死 状态 。 
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进程 除了 占用 用 户 空间 之 外 ,也 要 使 用 一 部 分 内 核 空 间 , 这 部 分 空间 主要 是 为 进程 的 
控制 块 所 使 用 。 进 程控 制 块 也 称 为 PCB(process control block) 块 ,通常 用 来 管理 进程 所 
访问 的 资源 ,实现 进程 调度 。PCB 块 类 似 于 进程 的 身份 证 ,保存 着 进程 的 众多 信息 ,其 中 
进程 号 PID 是 进程 存在 的 标志 。 

在 Linux 系统 中 ,PCB 块 是 一 个 task_struck 类 型 的 结构 体 , 这 一 结构 体 中 ,除了 记 
录 进 程 的 一 些 基本 属性 (例如 PID, PPID, UID, EUID 等 ) ,还 包括 与 进程 相关 的 线程 的 基 
本 信息 、 内 存 信息 .TTY 终端 信息 当前 目录 信息 、 打 开 的 文件 描述 符 信息 以 及 信号 信息 
等 内 容 。task_struck 结构 体 类 型 定义 在 头 文件 include/linux/sched. h 中 ,其 成 员 主要 可 
分 为 以 下 几 类 : 进程 号 .进程 状态 .线程 信息 文件 系统 信息 .内 存 相 关 数 据 , 用 户 信息 、 进 
程 调度 信息 、 信 号 处 理 函数 等 ,如 图 4.7 所 示 。 


task_struct 
进程 状态 [ state 
线程 信息 | thread_info =| thread info 
进程 调度 信息 | run listarray I—-|  runqueue 
进程 地 址 空间 | mm =| mm struct 
进程 号 | pid 
组 信息 | group_info 上 一 | group info 
用 户 信息 | user =] user struct 
文件 系统 信息 | fs p fs_struct 
文件 描述 符 | files —-| files struct 
信和 号 数据 | signal ~ signal struct 
信号 处 理 函 数 | sighand 
B ja sighand struct 


图 4.7 task struct 结构 体 


以 下 学 习 一 些 常用 的 属性 。 

1. 进程 号 和 父 进程 号 

涉及 进程 时 ,使 用 最 频繁 的 是 进程 的 进程 号 和 父 进 程 号 两 个 属性 。 在 Linux 系统 中 ， 
PID 号 是 系统 维护 的 一 个 非 负 整数 ,这 个 进程 号 在 创建 进程 时 确定 ,无 法 在 用 户 层 修改 。 
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除了 init 进程 ,其 他 进程 都 是 由 某 个 进程 创建 的 ,被 创建 的 进程 称 为 子 进 程 , 创 建 子 进程 
的 进程 称 为 父 进程 。 

在 一 个 进程 中 ,调用 getpid 函数 可 以 获得 它 的 PID, 其 函数 接口 规范 说 明 如 表 4. 2 
所 示 。 


表 4.2 getpid 函数 的 接口 规范 说 明 


函数 名 称 getpid 

函数 功能 获取 当前 进程 的 PID 号 
头 文件 # include-unistd. h> 
函数 原型 pid t getpidO ; 

参数 无 

返回 什 i 


其 中 pid_t 类 型 定义 来 自 于 头 文件 unistd.h, 它 将 内 核 数 据 类 型 __pid_t 重新 定义 为 
pid t 类 型 ,两 个 类 型 的 定义 如 下 : 


typedef _ pid t pid t; //usr/include/unistd.h 


_SIDTFE  PID T TYEE _ pidt; //usr/include/bit/types.h 
#define _ SID TYPE typedef 

# define __PID T TYE __ S32 TYFE 

# define _ S3) TYE IN 


从 以 上 定义 可 以 看 出 pid_t 类 型 其 实 就 是 inc 类 型 ,重新 定义 数据 类 型 有 利于 提高 代 
码 的 可 阅读 性 。 
在 多 进程 程序 运行 过 程 中 ,有 可 能 需要 获得 某 个 进程 的 父 进程 号 ,此 时 可 以 使 用 
getppid 系统 调用 ,其 函数 接口 规范 说 明 如 表 4. 3 所 示 。 
表 4.3 getppid 函数 的 接口 规范 说 明 


函数 名 称 getppid 

函数 功能 获取 当前 进程 的 父 进程 号 
头 文件 # include<unistd. h> 
函数 原型 pid t getppidO ; 

参数 无 

返回 什 PE Ue 


以 下 通过 示例 程序 4. 2exp. pid. c, 演 示 如 何 获取 当前 进程 的 进程 号 和 父 进程 号 。 


[示例 程序 4.2 exp pid.c] 
# include& stdio.h» 
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main() 


pid t pid, ppid; 
pid-getpid(); 
ppid-getppid(; 
printf ("PID is &d, its parent's PID is $d. Wn", pid, ppid); 
return 0; 
H 


示例 程序 4. 2 调用 getpid 获取 进程 号 ,调用 getppid 获取 父 进程 号 ,随后 将 二 者 输出 
显示 。 该 程序 编译 后 运行 ,得 到 运行 结果 如 下 。 


root@ubuntu:~ # gcc getpid exp.c -o exp pid 

root@ubuntu:~ # ./exp pid 

PID is 22399, its parent's PID is 22323. 

2. 进程 组 号 

每 个 进程 都 属于 一 个 或 多 个 进程 组 。 进 程 组 是 一 个 或 多 个 进程 的 集合 ,通常 与 同一 
作业 相关 联 ,接收 来 自 同一 终端 的 各 种 信号 。 每 个 进程 组 有 一 个 称 为 组 长 的 进程 ,组 长 进 
程 就 是 其 进程 号 (PID) 等 于 进程 组 号 (GID) 的 进程 , 即 进程 组 号 等 于 组 长 的 进程 号 ,进程 
组 存在 与 否 与 组 长 进程 是 否 存在 无 关 。 编 写 程序 时 ,可 使 用 系统 调用 getpgid 获取 进程 
组 号 ,setpgid 设置 进程 组 号 ,这 两 个 函数 接口 规范 说 明 如 表 4.4 和 表 4.5 所 示 。 

表 4.4 getpgid 函数 的 接口 规范 说 明 


函数 名 称 getpgid 

函数 功能 获取 进程 的 进程 组 号 

头 文件 # include<unistd. h> 

函数 原型 pid t getpgid(pid t pid ; 

参数 pid: 要 获取 进程 组 号 的 进程 PID 号 
返回 什 a A 


调用 getpgid 函数 后 KAAR ER A pid 的 进程 的 进程 组 号 。 当 参数 pid 为 0 
时 ,表示 获取 当前 进程 的 进程 组 号 。 
表 4.5 setpgid 函数 的 接口 规范 说 明 


函数 名 称 setpgid 

函数 功能 设置 进程 组 号 

头 文件 # include-Cunistd. h> 

函数 原型 pid t setpgid(pid t pid, pid t pgid); 
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续 表 
pid: 进程 PID 号 
-n pgid: 待 设置 的 进程 组 号 
Z1; 失败 
minio! 0; 成 功 


调用 setpgid 函数 后 ,将 会 把 进程 号 为 pid 的 进程 的 进程 组 号 设置 为 pgid。 当 参数 
pid 为 0 时 ,表示 设置 当前 进程 的 进程 组 号 ; 当 pgid 为 0 时 ,pid 进程 的 进程 组 号 将 被 设置 
为 自己 的 进程 号 , 即 pid 进程 成 为 进程 组 的 组 长 。 

3. 会 话 

会 话 是 一 个 或 多 个 进程 组 的 集合 ,每 个 会 话 有 唯一 一 个 会 话 首 进 程 。 会 话 号 等 于 会 
话 首 进程 的 进程 组 号 。 通 常情 况 下 ,用户 登 录 后 所 执行 的 所 有 程序 都 属于 一 个 会 话 , 而 其 
登录 的 Shell 则 是 会 话 首 进程 ,Shell 所 使 用 的 终端 就 是 会 话 的 控制 终端 。 

会 话 和 进程 组 的 关系 如 图 4. 8 所 示 。 


进程 组 1 


进程 组 3 || is-1 || head 


进程 组 2 


Is -1 grep 


bash:ls -llgrep root& 会 话 
bash:ls -llhead|wc 


图 4.8 会 话 和 进程 组 的 关系 


图 4.8 中 有 6 个 进程 ,分 属于 不 同 的 作业 ,对 应 3 个 进程 组 。 

会 话 中 有 会 话 首 进程 , 它 和 控制 终端 建立 连接 。 会 话 ID 号 即 会 话 首 进 程 的 进程 组 
号 。 编 写 程序 时 ,可 以 使 用 getsid 来 获取 会 话 ID 号 .使 用 setsid 创建 一 个 新 会 话 , 这 两 个 
系统 调用 接口 规范 说 明 如 表 4.6 和 表 4.7 所 示 。 


表 4.6 getsid 函数 的 接口 规范 说 明 


函数 名 称 getsid 
函数 功能 获取 进程 的 会 话 首 进程 号 
头 文件 * include-Cunistd. h> 
函数 原型 pid t getsid(pid t pid); 
参数 pid: 进程 PID 号 

m 会 
返回 什 人 


调用 getsid 函数 后 ,将 会 获得 进程 号 为 pid 的 进程 所 在 会 话 的 首 进程 号 , 当 参 数 pid 
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为 0 时 表示 获取 当前 进程 的 会 话 号 。 
表 4.7 setsid 函数 的 接口 规范 说 明 


函数 名 称 setsid 

函数 功能 创建 一 个 新 会 话 并 设置 进程 组 号 
头 文件 #include<unistd. h> 

函数 原型 pid t setsidCvoid) ; 

参数 无 
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使 用 setsid 函数 时 ,调用 setsid 函数 的 进程 不 能 是 进程 组 长 ,否则 调用 出 错 ; 非 组 长 
进程 调用 setsid 之 后 ,将 会 创建 一 个 新 的 会 话 , 该 进程 会 被 加 入 这 个 新 会 话 并 成 为 这 个 会 
话 的 首 进 程 以 及 新 进程 组 的 组 长 ,并 与 控制 终端 切断 联系 。 新 会 话 的 ID 号 和 新 进程 组 的 
组 ID 号 为 调用 setsid 函数 的 进程 的 PID, 此 时 该 进程 是 新 会 话 和 新 进程 组 中 唯一 的 
进程 。 

4. 控制 终端 

会 话 首 进程 打开 一 个 控制 终端 后 ,该 终端 就 成 为 此 会 话 的 控制 终端 。 一 个 会 话 可 以 
有 一 个 控制 终端 ,一 个 控制 终端 只 能 控制 一 个 会 话 , 与 控制 终端 连接 的 会 话 首 进程 被 称 为 
控制 进程 。 当 前 与 终端 交互 的 进程 所 在 的 进程 组 称 为 前 台 进 程 组 ,其 余 进 程 组 称 为 后 台 
进程 组 。 

产生 在 控制 终端 上 的 输入 和 信号 将 发 送 给 前 台 进 程 组 中 的 所 有 进程 ;如 果 终 端 接口 
检测 到 连接 断 开 , 则 将 挂 断 信号 发 送 至 控制 进程 (会 话 首 进 程 ); 如 果 会 话 首 进程 终止 , 则 
该 信号 发 送 到 该 会 话 前 台 进 程 组 的 所 有 进程 。 控 制 终端 会话、 进程 组 之 间 的 关系 如 
图 4.9 所 示 。 


控制 终端 
/ 
7 
一 
会 话 首 进程 
sen | 后 台 进程 组 。 进程 组 3 Is -1 head 
wc 
ls -1 grep 
前 台 进程 组 

后 台 进程 组 

bash:ls -llgrep root& d 
bash:ls -Ijhead|wc 会 话 


图 4.9 控制 终端 .会话 和 进程 组 的 关系 
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从 图 中 可 以 看 到 ,此 会 话 有 一 个 控制 终端 ,控制 进程 为 会 话 首 进程 shell ,会话 中 共有 
3 个 进程 组 ,其 中 有 一 个 前 台 进 程 组 接收 控制 终端 的 输入 ,其 他 两 个 均 为 后 台 进 程 组 。 

可 以 使 用 系统 调用 tcgetpgrp 和 tcsetpgrp 来 获取 或 设置 与 控制 终端 连接 的 前 台 进 程 
组 。 这 两 个 系统 调用 接口 规范 说 明 如 表 4.8 和 表 4. 9 所 示 。 


表 4.8 tegetpgrp 函数 的 接口 规范 说 明 


函数 名 称 tcgetpgrp 

函数 功能 获取 指定 控制 终端 的 前 台 进程 组 号 
头 文件 # include- unistd. h> 

函数 原型 pid t tcgetpgrp(int fd) ; 

参数 fd: 指定 控制 终端 对 应 的 文件 描述 符 
EE ree ID 9) 


表 4.9 tesetpgrp 函数 的 接口 规范 说 明 


函数 名 称 tcsetpgrp 

函数 功能 设置 控制 终端 的 前 台 进程 组 

头 文件 #include<unistd. h> 

函数 原型 pid t tcsetpgrp(int fd, pid t pgrp); 

参数 fd: 指定 控制 终端 对 应 的 文件 描述 符 
pgrp: 待 设置 为 前 台 进 程 组 的 组 ID 号 

sua "su 


在 使 用 tegetpgrp 时 ,参数 £d 对 应 的 控制 终端 必须 是 调用 tegetpgrp 进程 的 控制 终 
端 ,否则 调用 会 失败 。 

进程 要 有 一 个 控制 终端 , 才 可 以 调用 tcsetpgrp 函数 ;进程 组 号 为 pgrp 的 进程 组 和 调 
用 tcsetpgrp 的 进程 必须 在 同一 个 会 话 中 ;fd 必须 联系 该 会 话 的 控制 终端 ,否则 调用 会 
失败 。 

通常 用 户 程序 不 会 直接 调用 以 上 两 个 系统 调用 。 大 多 数 情况 下 ,它们 是 由 作业 控制 
Shell 调用 的 。 除 了 这 两 个 系统 调用 之 外 ,还 可 以 使 用 系统 调用 tcgetsid 来 获取 与 控制 终 
端 相 联系 的 会 话 的 首 进程 号 ( 即 会 话 首 进程 的 进程 组 ID 号 ) 。 

5. 综合 示例 

以 下 通过 一 个 程序 exp. process. c 来 演示 上 述 系统 调用 的 使 用 方法 。 


[示例 程序 4.3 exp. process.c] 
# include< stdio.h> 

# include< stdlib.h» 

# include< unistd.h» 

# include fentl.h» 
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main() 


int fd; 
printf ("pid= $d,parent's id- $d\n",getpid() ,getzpid () ) 
printf ("process group id= $d,parent's pgid- &dn"', 
getpgid (getpid ()) , getpgid (getgpid () )) ; 
printf ("session id- $d,parent's session id= $dWn",getsid(getpid()), 
getsid (getppid()); 
fd- open ("/dev/tty",O RUWR) ; 
if(fd---1) 
t 
perror ("open"); 
exit(EXIT FAILURE); 
j 
printf ("foreground process id- &dWn",togetpgrp (fd) 7 
return (close (fd) ) ; 
) 


编译 后 执行 ,结果 如 下 : 


root@ubuntu:~ # goc exp prooess.c - o exp Process 

root&ubuntu:- # ./exp process 

pid= 2239», parent's id= 22323 

process group id= 22392, parent's pgid- 22323 

session id= 22323,parent's session id= 22323 

foreground process id- 22392 

从 示例 程序 4. 3 中 可 以 看 出 ,程序 exp. process 对 应 的 进程 PID 号 为 22392 ,运行 该 
程序 的 Shell 进程 号 为 会 话 号 为 22323。 这 两 个 进程 分 属于 不 同 的 进程 组 ,进程 组 号 分 别 
为 22392 和 22323, 即 这 两 个 进程 分 别 为 各 自 进程 组 的 组 长 进程 。 两 个 进程 都 属于 同一 
个 会 话 ,会 话 号 为 22323, 即 Shell 是 这 个 会 话 的 会 话 首 进程 。Shell 也 是 控制 终端 的 控制 
进程 ,而 与 该 控制 终端 相 联 系 的 前 台 进 程 组 组 长 是 进程 exp_process。 
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在 进程 的 属性 中 有 一 部 分 是 用 来 记录 和 用 户 相 关 的 信息 ,例如 真实 用 户 有 效用 户 
等 。 为 什么 要 记录 这 些 信息 呢 ? 从 第 3 章 可 以 知道 ,为 了 保证 passwd 命令 的 正确 运行 ， 
passwd 命令 对 应 的 进程 不 只 要 记录 真实 用 户 以 保证 不 会 修改 其 他 用 户 的 密码 ,还 要 记录 
进程 的 有 效用 户 以 保证 进程 能 够 成 功 访问 /eetc/passwd 文件 。 因 此 ,进程 需要 保存 正常 
运行 所 需 的 用 户 信 息 ,主要 包括 以 下 内 容 。 

1. 真实 用 户 号 (RUID) 

用 户 在 登录 系统 时 ,系统 将 会 记录 该 登录 用 户 。 在 不 做 修改 的 情况 下 ,随后 在 这 一 连 
接 中 建立 的 进程 真实 用 户 均 为 登录 用 户 。 进 程 在 创建 时 ,将 会 记录 下 进程 创建 者 的 ID 号 
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作为 其 真实 用 户 号 ,通常 为 当前 的 登录 用 户 。 

2. 进程 有 效用 户 号 (EUID) 

大 多 数 情况 下 进程 的 有 效用 户 号 和 真实 用 户 号 相同 , 当 进 程 对 应 的 程序 文件 被 设置 
了 有 效用 户 位 时 ,进程 的 有 效用 户 就 是 程序 文件 的 属 主 , 此 时 进程 享有 文件 属 主 的 特权 ， 
可 以 访问 只 有 程序 文件 属 主 才能 访问 的 一 些 文件 。 有 效用 户 号 EUID 主要 用 于 权限 
检测 。 

3. 保存 的 设置 用 户 号 (REUID) 

当 进 程 的 真实 用 户 号 和 有 效用 户 号 不 同时 ,意味 着 此 时 进程 拥有 有 效用 户 所 具有 的 
权限 。 如 果 进 程 在 运行 过 程 中 某 一 时 刻 需要 访问 真实 用 户 才 能 访问 的 资源 ,这 就 需要 进 
程 具有 真实 用 户 的 权限 ,因此 需要 将 进程 的 有 效用 户 号 改 为 真实 用 户 号 ,之 后 如 果 又 需要 
访问 之 前 有 效用 户 才能 访问 的 文件 ,又 该 怎么 办 呢 ? 由 此 可 见 , 在 上 一 步 修 改 有 效用 户 号 
时 ,应 保存 之 前 的 有 效用 户 号 ,这 样 在 后 边 的 步骤 中 就 可 以 轻松 地 将 有 效用 户 号 修改 回来 
了 。 进 程 的 设置 用 户 号 用 来 保存 有 效用 户 号 或 真实 用 户 号 。 

可 以 使 用 getuid .geteuid 系统 调用 来 获取 真实 用 户 号 和 有 效用 户 号 ,其 函数 接口 规 
范 说 明 如 表 4. 10 和 表 4. 11 所 示 。 


表 4.10 getuid 函数 的 接口 规范 说 明 


函数 名 称 getuid 
函数 功能 获取 进程 的 真实 用 户 号 

# include-unistd. h> 
AE * include sys/types. h> 
函数 原型 uid t getuid( void) ; 
参数 无 
二 一 1: 成 功 (真实 用 户 号 ) 
din 一 1, 失败 

表 4.11 geteuid 函数 的 接口 规范 说 明 

函数 名 称 geteuid 
函数 功能 获取 进程 的 有 效用 户 号 

# include— unistd. h> 
XE # include sys/types. h> 
函数 原型 uid t geteuid(void) ; 
参数 无 
—1: 成 功 ( 有 效用 户 号 ) 
PEN 一 1: 失败 


如 果 要 修改 有 效用 户 号 ,可 以 使 用 setuid 或 seteuid 系统 调用 。seteuid 只 对 有 效用 
户 号 做 修改 ,setuid 根据 进程 的 真实 用 户 来 修改 用 户 号 。 如 果 进 程 的 真实 用 户 是 root 用 
户 , 调 用 setuid 后 ,真实 用 户 号 有 效用 户 号 和 保存 的 设置 用 户 号 将 同时 被 修改 为 参数 
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uid; 如 果 进 程 的 真实 用 户 不 是 root, 则 setuid 只 修改 有 效用 户 号 。 

4. 进程 用 户 组 号 (GID)、 进 程 有 效用 户 组 号 和 保存 的 进程 用 户 组 号 

以 上 针对 用 户 的 内 容 同样 适用 于 各 个 组 ID。 可 以 使 用 系统 调用 getgid 和 getegid 来 
获取 真实 组 号 和 有 效 组 号 ,这 两 个 函数 接口 规范 说 明 如 表 4. 12 和 表 4. 13 所 示 。 


表 4.12 getgid 函数 的 接口 规范 说 明 


函数 名 称 getgid 
函数 功能 获取 进程 的 真实 组 号 

# include-unistd. h> 
头 文件 # include sys/types. h> 
函数 原型 uid t getgid( void); 
参数 无 
y 二 一 1: 成 功 (真实 组 号 ) 
i 一 1: 失败 

表 4.13 getegid 函数 的 接口 规范 说 明 

函数 名 称 getegid 
函数 功能 获取 进程 的 有 效 组 号 

# include-unistd. h> 
头 文件 # include sys/types. h> 
函数 原型 uid t getegid( void) ; 
参数 无 
ij 二 一 1: 成 功 ( 有 效 组 号 ) 
返回 值 一 1, 失败 


5. 综合 示例 
以 root 权限 编写 下 面 的 程序 。 


[示例 程序 4.4 exp uid.c] 
# includec stdio.h> 

# includec stdlib.h> 

# includec unistd.h> 


int main() 

{ 
printf ("uid= $d,euid- $d Wn", getuid() ,geteuid()); 
printf ("gid- &d,egid- &dWn",getgid() ,getegid()) ; 
retum 0; 

) 


然后 编译 并 设置 程序 文件 的 有 效用 户 位 : 


root&ubuntu:^ # goc exp uid.c -o exp uid 
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root@ubuntu:~ # 1s -1 

一 rwxrwxr-x 1 root root 7016 Aug 21 15:42 exp uid 
-rw-rw-r-- lrootroot 209 Aug 21 15:34 exp uid.c 
root&ubuntu:- $ chmod ut s exp uid 
root@ubuntu:~ # 1s -1 

total 16 

— rwsrwxr-x 1 root root 7016 Aug 21 15:42 exp uid 
-rw-rw-r-- 1 root root 209 Aug 21 15:34 exp uid.c 


之 后 ,分 别 以 普通 用 户 和 root 用 户 的 身份 分 别 运行 程序 ,请 观察 两 次 运行 的 差别 ,分 
析 不 同 之 处 及 其 产生 的 原因 。 


4.3 进程 管理 


从 进程 的 定义 中 可 以 看 出 ,进程 是 一 个 动态 的 概念 ,因此 它 有 生命 周期 。 一 个 进程 从 
创建 时 获得 生命 ,中 间 历 经 各 种 状态 的 变化 ,最 终 从 系统 中 消失 ,生命 结束 。 这 一 过 程 需 
要 操作 系统 提供 相应 的 手段 来 实现 进程 管理 。 进 程 管理 包括 创建 进程 .执行 进程 .进程 退 
出 等 操作 。 
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1. fork 系统 调用 
在 Linux 系统 中 ,可 以 使 用 系统 调用 fork 来 创建 新 的 进程 ,fork 的 接口 规范 说 明 如 
表 4.14 所 示 。 


表 4.14 fork 函数 的 接口 规范 说 明 


函数 名 称 fork 

函数 功能 创建 一 个 进程 

头 文件 include unistd. h> 

函数 原型 pid t forkCvoid) ; 

参数 无 

返回 什 a i 0) 

fork 系统 调用 是 一 个 比较 特殊 的 函数 ,从 总 体 上 看 ,该 函数 返回 两 个 值 。 但 从 父子 


进程 各 自 的 角度 来 看 ,只 返回 了 一 个 值 。 从 父 进 程 的 角度 看 ,如 果 fork 调用 失败 返回 
一 1, 调 用 成 功 返 回 创建 的 子 进程 的 进程 号 ,这 样 就 可 以 从 众多 的 进程 中 区 分 出 本 次 创建 
的 子 进程 是 谁 ;从 子 进程 的 角度 来 看 .如果 fork 调用 失败 , 子 进程 也 就 不 存在 ,如 果 调 用 
成 功 , 子 进程 复制 父 进程 的 代码 从 fork 所 在 代码 行 之 后 开始 执行 ,获取 fork 的 返回 值 为 
0, 子 进程 想 要 获知 其 进程 号 或 父 进程 号 时 ,可 以 使 用 getpid 和 getppid 函数 。 

用 户 程序 调用 fork 后 «fork 调用 内 核 的 fork 代码 ,完成 以 下 工作 : 
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CD 为 子 进程 分 配 新 的 内 存 块 和 内 核 数据 结构 。 

(2) 复制 父 进程 的 信息 到 子 进程 空间 中 (数据 区 ,堆栈 一 些 属性 )。 
(3) 向 运行 进程 组 中 添加 新 的 进程 。 

(4) 将 控制 返回 给 父子 两 个 进程 。 

下 面 通过 一 个 例子 来 学 习 fork 函数 的 使 用 。 


[示例 程序 4.5 fork hello.c] 
# include< stdio.h> 

# include< stdlib.h> 

# include< unistd.h> 


main() 
i 
pid t pid; 
if((pid- fork())==-1) 
i 
perror ("fork"); 
exit (EXIT FAITURE); 
} 
printf ("hello\n"); 
retum 0; 
) 


编译 后 运行 得 到 如 下 结果 : 


root@ubuntu:~ # gcc fork hello.c -o exp forkl 
root@ubuntu:~ # ./exp forkl 

hello 

rootQ$ubuntu:^ # hello 


在 示例 程序 4. 5 中 , 子 进程 和 父 进 程 运行 的 代码 相同 ,运行 的 起 点 是 让 语句 中 的 条 件 
判断 , 子 进程 一 出 生 就 获取 了 fork 的 返回 值 为 0, 赋 给 pid 后 与 一 1 比较 ,结果 不 相等 , 因 
此 执行 话语 句 的 后 续 语 句 。 

需要 注意 的 是 ,尽管 fork 创建 的 子 进程 将 会 复制 父 进程 的 资源 ,例如 代码 区 和 数据 
区 的 内 容 、 进 程 组 号 ,打开 的 文件 描述 符 表 等 ,但 其 他 的 (例如 一 些 权 限 、 进 程 状态 和 优先 
级 .警告 等 ) 不 会 从 父 进程 那里 继承 。 

创建 子 进程 的 目的 是 为 了 执行 新 的 任务 ,因此 在 程序 中 需要 根据 父子 进程 来 安排 执 
行 不 同 的 代码 。 那 么 该 如 何 来 区 分 父子 进程 呢 ? 此 时 fork 的 返回 值 就 是 区 分 父子 进程 
的 关键 了 。 示 例 程序 4. 6 分 别 在 父子 进程 中 输出 各 自 的 进程 号 。 

[示例 程序 4.6 fork fut.c] 

# include< stdio.h> 

# include< unistd.h» 
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int main() 
{ 
pidt pid; 
printf ("Let's distinguish parent and child!in"); 
pid fork ; 
switch (pid) 
t 
case - 1: perror ("fork"); break; 
case 0: printf ("This is child process, pid- €d, ppid- $d!Wn", getpid(), 


getppid()); 
break; 
default: sleep(1); 
printf ("This is parent process, pid- $d! Wn", getpid()) ; 
break; 


retum 0; 
} 


编译 后 运行 结果 如 下 : 


rootéubuntu:- # goc fork fmt.c -o fork fm 
root@ubuntu:~  ./fork fmt 

Let's distinguish parent and child! 

This is child process, pid 29172, ppid- 29171! 
This is parent process, pid= 29171! 


这 样 一 来 ,就 可 以 为 父子 进程 安排 不 同 的 代码 ,完成 不 同 的 任务 。 

2. 循环 中 使 用 fork 

调用 fork 函数 成 功 的 话 将 会 产生 一 个 子 进程 ,那么 如 果 fork 调用 出 现在 循环 结构 
中 ,又 将 产生 怎样 的 影响 ? 

以 下 通过 示例 程序 4. 7 来 分 析 一 下 : 在 这 个 程序 中 ,fork 产生 了 几 个 子 进程 ? 


[示例 程序 4.7 fork and locp.c] 
# includec stdio.h> 

f includec unistd.h> 

# include< sys/types.h> 


main() 
{ 
pid t pid; 
int i-1; 
while(i« 4) 
1 
pid-fork(; 
if(pid-- 0) 
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printf ("No. sd process, my pid is sd.\n" i, getpid()); 
if(t-1) 
retum 0; 


在 这 个 程序 中 ,i 等 于 1 时 ,创建 了 第 一 个 子 进程 ,随后 父 进 程 和 创建 的 第 一 个 子 进 程 
都 会 继续 执行 下 一 轮 循环 , 在 各 自 进程 中 i 等 于 2 时 各 产生 了 一 个 子 进程 ,以 此 类 推 ,总 
共产 生 了 5 个 新 的 子 进 程 ,它们 与 父 进程 的 关系 如 图 4. 10 所 示 。 


4.10 示例 程序 4.7 的 进程 树 结构 


这 个 结果 是 否 如 你 所 料 呢 ? 

示例 程序 4.7 提醒 读者 注意 : 当 Fork 和 循环 结合 使 用 时 ,一定 要 非常 小 心 , 避 免 产 生 
无 用 的 进程 ,无 用 的 进程 将 会 占用 大 量 系统 资源 。 

思考 问题 如 果 示 例 程序 中 去 掉 *if(i! 王 1) return 0;” 语 句 , 又 会 产生 多 少 个 子 进程 ? 
它们 与 父 进程 构成 的 进程 树 结构 又 是 怎样 的 ? 
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当 可 以 利用 fork 的 返回 值 区 分 父子 进程 后 ,就 可 以 使 用 eXec 族 函 数 来 让 子 进程 执 
行 新 的 代码 了 。 

为 了 让 子 进程 执行 的 代码 与 父 进程 不 同 ,可 以 在 子 进程 对 应 的 分 支 中 写 入 新 的 代码 ， 
但 这 并 不 是 一 个 好 的 方法 。 第 一 , 父 进程 在 执行 过 程 中 ,其 代码 段 包 含 了 子 进程 的 代码 ， 
既 不 安全 也 浪费 空间 ;第 二 ,车 以 此 方法 类 推 , 子 进程 再 创建 的 子孙 进程 所 要 执行 的 代码 
都 需要 写 在 一 个 程序 中 ,显然 这 种 方法 所 有 的 代码 最 终 都 会 写 在 一 个 程序 中 。 

另 一 个 方法 就 是 将 各 个 功能 设计 成 互相 独立 的 可 执行 程序 ,用 eXec 族 函 数 来 执行 这 
些 程序 。eXec 族 函数 是 6 个 以 exec 开头 的 功能 类 似 的 函数 和 系统 调用 的 统称 。eXec 族 
函数 是 以 新 的 进程 代码 去 代替 原来 的 进程 代码 ,但 进程 的 PID 保持 不 变 。 因 此 , eXec 族 
函数 并 没有 创建 新 的 进程 ,只 是 蔡 换 了 原来 进程 上 下 文 的 内 容 , 即 原 进程 的 代码 段 、 数 据 
Bt HEBEL BUB ERR ICE 
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这 里 先 以 execvp 为 例 ,学 习 如 何 让 子 进程 执行 新 的 代码 。execvp 函数 的 接口 规范 说 
明 如 表 4. 15 所 示 。 


表 4.15 execvp 函数 的 接口 规范 说 明 


函数 名 称 execvp 
函数 功能 在 进程 中 执行 指定 代码 
头 文件 # include<unistd. h> 
函数 原型 int execvp(char * file, char * argv[]); 
on file. 待 运行 的 程序 
argv: 执行 file 所 需要 的 参数 (以 NULL 结尾 ) 
nins EE. M 


execvp PATI WAITER: 当 用 户 进程 调用 execvp 函数 后 ,内 核 将 按照 程序 名 ,将 
程序 的 内 容 加 载 到 用 户 进程 空间 ,同时 将 参数 表 argv 复制 到 进程 中 ,最 后 内 核 调 用 新 加 
载 程序 的 main(argc，argv) ,同时 还 会 调整 进程 的 内 存 分 配 使 之 适应 新 的 程序 对 内 存 的 
ER. 

示例 程序 4. 8 是 一 个 使 用 execvp 的 例子 。 

[示例 程序 4.8 emp_execvp.c] 

# include< stdio.h» 

# include< unistd.h» 

int main() 

t 

char * argv[]- ("cp", "/etc/passwd", "tmppass", NULL) 
printf ("Let's use execvp. Vn") ; 
execvp ("cp",argy) ; 
printf (xxxxxThis is the engeeeeem) ; 
H 


编译 后 运行 得 到 以 下 结果 : 


root@ubuntu:~ $ goc exp execvp.c -o exp execvp 
root@ubuntu:~ # ./ exp execvp 

let's use execvp.! 

rootéubuntu:^ # cat trppass 
root:x:0:0:root:/root:/bin/bash 
bin:x:l:l:bin:/bin:/sbin/nologin 
daemon:x:2:2:daemn: /sbin: /sbin/nologin 


sync:x:5:0:sync: /sbin: /bin/sync 
shutdown:x:6:0:shutdown:/sbin: /sbin/shutdown. 
halt:x:7:0:halt:/sbin:/sbin/balt 
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mai l:x:8:12:mai 1: /var//spool /mail:/sbin/nologin 
uucp:x:10:14:uucp: /var/spool /uucp: /sbin/nologin 


从 运行 结果 中 可 以 看 出 ,示例 中 的 程序 使 用 execvp 函数 执行 了 cp 命令 的 代码 ， 
tmppass 文件 复制 了 /etc/passwd 文件 的 内 容 。 另 外 ,由 于 execvp 调用 成 功 ,cp 命令 的 代 
码 覆 盖 了 程序 原来 的 代码 ,所 以 程序 中 最 后 一 条 语句 的 内 容 并 未 输出 在 显示 器 上 o 

eXec 族 函 数 中 ,其 他 5 个 与 execvp 类 似 , 具 体 如 下 : 


execl(const char* filepath,const char* argl,char* arg2…) 
execlp (const char* filename,const char* argl,const char* arg?" ) 

execle (const char * filepath,const char * argl,const char* arg2,"*,char* cons envp[]) 
execv(const charx filepath,char* argv[]) 

execve(const char* filepath,char* argv[],char* const envp[]) 


其 中 ,只 有 execve 是 系统 调用 ,其 他 5 个 都 是 库 函 数 , 最 终 都 会 调用 execve。 它 们 之 间 的 
关系 如 图 4.11 所 示 。 


execlp execl execle 
建立 argv 建立 argv 建立 argv 
execvp execv execve 
尝试 每 个 PATH 前 组 使 用 environ 


图 4.11 eXec 族 函 数 之 间 的 关系 


在 这 些 函数 名 中 ,除了 exec 之 外 的 字母 各 有 含义 : 

。 1: 以 列表 形式 列 出 参数 。 

. v: 以 数组 形式 列 出 参数 。 

top: 在 系统 路 径 中 查找 代码 程序 。 

* 6e: 将 环境 变量 设置 为 参数 , 即 把 新 的 环境 指定 到 新 进程 中 。 

例如 ,都 是 让 进程 运行 ls -1 命令 ,这 6 个 函数 和 系统 调用 的 格式 如 下 所 示 : 


char * 1s argv[]- ("1s", "- 1", NULL); 

char * ls envp[]- ("PATH- bin:usr/bin", "TERM- console", NULL); 

execl ("/bin/1s", "1s", "- 1", NULL); 

execy ("/bin/1s",ls argv); 

execle ("/bin/1s", "Is", "- 1", NULL, 1s envp); 

execve ("/bin/1ls", ls argv, ls envp); 

execlp("15", "Is", "- 1", NULI); 

execyp("15", 1s argv); 

在 上 面 的 代码 中 ,进程 执行 了 系统 命令 ,需要 注意 : 无 论 是 以 数组 形式 表示 参数 ,还 
是 以 列表 形式 表示 参数 ,参数 结束 都 要 以 NULL 来 表示 ,和 否则 调用 时 会 发 生 错误 。 
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示例 程序 4. 9 创建 子 进 程 ,让 子 进程 执行 一 个 已 编写 好 的 用 户 程序 hello; hello f£ 
序 的 源 代码 如 下 : 


# includec stdio.h> 
main() 
{ 
printf ("Hello world!Wn") ; 
retum 0; 
H 
将 其 编译 为 可 执行 程序 hello, 随 后 在 同一 目录 下 编写 示例 程序 4.9 如 下 : 
[示例 程序 4.9 exp. exec.c] 
# include< stdio.h» 
# include< unistd.h> 
main() 
t 
pid t pid; 
int flag; 
char * envp[]- ("PATH- .",NULL); 
if((pid- fork())- — 0) 
t 
printf ("in child process: Vn") ; 
£lag- execve ("./hello", NULL, envp) ; 
if(flag-- -1) 
printf ("exec error!Wn") ; 
D: 
printf ("in parent process n") ; 
return 0; 
) 
在 示例 程序 4. 9 中 ,参数 envp 将 路 径 设 置 为 当前 目录 ,随后 用 fork 函数 创建 了 一 个 
新 进程 ,如 果 创 建成 功 , 程 序 将 会 调用 execve 执行 用 户 程序 hello; 如 果 创 建新 进程 不 成 
功 ,提示 相应 信息 , 父 进 程 输出 “in parent processe”. 
eXec JE PA ILES system 函数 都 可 以 执行 系统 命令 或 可 执行 程序 ,但 两 者 执行 命令 的 
方式 不 同 。eXec 族 函 数 是 直接 用 新 的 进程 去 代替 原来 的 进程 ,运行 完毕 之 后 不 再 回 到 原 
先 的 进程 中 去 。system 函数 是 调用 Shell 来 执行 命令 , 即 system 王 fork 十 eXec 十 waitpid , 
执行 完毕 后 ,会 回 到 原先 的 进程 中 ,继续 执行 后 续 的 代码 。 
学 习 到 这 里 ,细心 的 读者 会 发 现 一 个 问题 : fork 执行 过 程 中 ,会 将 父 进程 的 数据 等 信 
息 复制 到 子 进程 中 ,这 个 复制 过 程 耗费 了 大 量 的 系统 资源 ,而 子 进程 调用 eXec 函数 后 又 
会 将 新 程序 的 内 容 加 载 到 子 进程 空间 ,因此 可 以 说 ,创建 子 进程 时 复制 的 父 进程 资源 都 没 
有 用 到 就 被 覆盖 了 。 这 种 资源 浪费 可 以 避免 么 ,或 者 说 可 不 可 以 创建 子 进程 的 时 候 不 复 
制 父 进程 资源 ? 
答案 是 : 可 以 使 用 vfork 系统 调用 。 
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433 vak 函 数 
vfork 与 fork 一 样 ,调用 成 功 后 会 创建 一 个 子 进程 。 它 与 fork 不 同 之 处 在 于 : 创建 
的 子 进程 在 调用 eXec 或 exit 之 前 将 在 父 进程 的 地 址 空间 中 运行 ,而 父 进程 在 这 段 时间 
里 将 处 于 不 可 中 断 阻塞 状态 。vfork 函数 的 接口 规范 说 明 见 表 4. 16。 
表 4.16 vfork 函数 的 接口 规范 说 明 


函数 名 称 vfork 

函数 功能 创建 一 个 子 进程 

头 文件 # include<unistd. h> 

函数 原型 pid t vfork(void) ; 

参数 无 

EE EN E NER MENORES EEESM 0) 


以 下 通过 示例 程序 4. 10 来 观察 fork 与 vfork 的 差别 。 


[示例 程序 4.10 exp. vfork.c] 
# include< stdio.h> 
# include< unistd.h» 


int glob- 3; 
int main() 
{ 
int var-8, i- 3; 
pid t pid; 
printf ("before vforkNn") ; 
if((pid- vfork())« 0) 
t 
Perror ("vfork"); 
exit(- 1); 
j 
else if(pid-- 0) 
t 
while(i -->0) 
t 
sleep(1); 
gidot*; 
vartt; 
printf ("pid= &d,glab- $d,var- $dWn", getpid(), glcb, var); 
exit(EXIT SUXESS); 
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printf ("pid= sd,glcbr %d,var= $dn", getpid(), glcb, var); 
exit(EXIT SUCCESS); 

} 

将 示例 程序 4. 10 编译 运行 ,得 到 结果 如 下 : 

root&ubuntu:- $ goc exp vfork.c -o exp vfork 

root@ubuntu:~ # ./exp vfork 

before vfork: 

pid- 552,gldb- 3,var- 8 

child pid= 553, gldb- 4, var- 9 

child pid= 553, gldb- 5, var- 10 

child pid= 553, gldb- 6, var- 11 

parent pid= 552,glob- 6,var- 11 

随后 ,将 vfork 改 为 fork 再 来 编译 执行 ,观察 其 结果 : 


root@ubuntu:~ # gcc exp vfork.c -o exp fork 

root@ubuntu:~ # ./exp fork 

before fork: 

pid- 564, gldo- 3,var- 8 

parent pid= 564, gldb- 3, var- 8 

root@ubuntu:~# child pid= 565,gldb- 4,var- 9 

child pid= 565, gldb- 5, var- 10 

child pid= 565, gldo- 6, var- 11 

比较 一 下 两 次 运行 的 结果 会 发 现 有 以 下 不 同 : 

(1) 父子 进程 交替 执行 的 顺序 不 同 。 在 vfork 的 运行 结果 中 , 子 进程 三 次 输出 都 完 
成 以 后 , 父 进程 中 的 内 容 才 输 出 ;而 fork 的 结果 中 , 父 进 程 先 于 子 进程 输出 。 由 此 可 以 看 
出 ,调用 vfork 和 fork 之 后 父 进程 的 状态 是 不 一 样 的 。 

(2) 变量 的 值 不 同 。 在 vfork 的 运行 结果 中 , 子 进 程 将 全 局 变量 glob 的 值 改 为 6, 局 
部 变量 var 的 值 改 为 11, 父 进程 中 输出 的 值 也 是 6 和 11, 说 明 父子 进程 使 用 变量 相同 , 即 
父子 进程 运行 在 同一 地 址 空间 ;fork 的 运行 结果 中 , 子 进程 输出 6 和 11, 父 进程 输出 为 3 
和 8, 父子 进程 引用 的 变量 并 不 相同 。 由 此 可 以 见 ,vfork 中 父子 进程 共享 地 址 空间 ,fork 
中 父子 进程 各 自 有 各 自 的 地 址 空间 。 

从 示例 程序 4. 10 可 以 看 到 vfok 同样 可 以 创建 子 进 程 ,又 避免 了 fork 后 直接 调用 
eXec 时 复制 父 进程 资源 造成 的 资源 浪费 ,这 样 看 起 来 使 用 vfork 创建 子 进程 是 一 个 更 好 
的 方法 ,但 事实 并 非 如 此 ,vfork 函数 同样 存在 着 一 些 问题 。 

例如 ,调用 vfork 创建 子 进程 后 ,如 果子 进程 需要 和 父 进 程 通信 ,获取 父 进程 发 来 的 
某 些 信息 ,很 显然 ,此 时 由 于 父 进程 处 于 不 可 中 断 阻塞 态 , 将 无 法 回应 子 进程 。 除 此 之 外 ， 
由 于 子 进程 在 未 调用 eXec 或 exit 前 ,占用 了 父 进程 的 地 址 空间 ,因此 有 可 能 修改 父 进程 
的 数据 ,出 现 错误 ,这 些 都 是 很 严重 的 问题 。 因 此 ,在 实际 应 用 中 创建 子 进程 还 是 使 用 
fork 函数 。 这 看 起 来 又 回 到 了 老 问题 上 : 如 何 避 免 fork 子 进 程 后 , 子 进程 直接 调用 eXec 
函数 时 复制 父 进程 资源 造成 的 资源 浪费 ? 实际 上 ,现在 在 Linux 系统 中 使 用 了 一 项 称 为 
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“ 写 时 复制 "(Copy-on-Write) 的 技术 来 避免 这 一 浪费 。 


写 时 复制 是 一 种 可 以 推迟 甚至 避免 复制 数据 的 技术 。 写 时 复制 是 在 fork 函数 创建 
子 进程 时 ,内 核 并 不 复制 父 进程 的 整个 进程 空间 给 子 进程 ,而 是 让 父 进程 和 子 进程 共享 同 
一 个 副本 。 只 有 在 需要 写 入 的 时 候 , 数 据 才 会 被 复制 ,从 而 使 父 进 程 子 进程 拥有 各 自 的 
副本 。 也 就 是 说 ,资源 的 复制 只 有 在 需要 执行 写 人 操作 的 时 候 才 进行 ,在 此 之 前 以 只 读 方 
式 共 享 。 这 种 技术 使 得 对 地 址 空间 中 的 页 的 复制 被 推迟 到 实际 发 生 写 和 的 时 候 。 上 面 提 
到 过 的 fork 子 进程 后 立即 执行 eXec, 在 这 种 情况 下 就 完全 不 需要 复制 父 进程 资源 了 ,这 
种 优化 可 以 避免 复制 大 量 根本 就 不 会 使 用 的 数据 。 
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进程 退出 也 就 是 进程 生命 的 终止 ,进程 运行 过 程 中 有 8 种 情况 会 导致 进程 终止 退出 。 
其 中 ,正常 的 终止 退出 方式 有 5 种 ,分 别 是 : 

(1) 从 main 返回 (return 或 隐 含 ) 。 

(2) 进程 运行 过 程 中 调用 了 exit KR 

(3) 进程 运行 过 程 中 调用 了 _exit 函数 或 _Exit 函数 。 

(4) 进程 的 最 后 一 个 线程 从 其 启动 例 程 返回 。 

G) 进程 的 最 后 一 个 线程 调用 pthread_exit。 

exit 和 return 的 差异 是 : exit 是 一 个 有 参 函 数 ,return 是 一 条 函数 中 的 返回 语句 ; 
exit 执行 完 后 把 控制 权 交 给 系统 ,return 执行 完 后 把 控制 权 交 给 主 调 函 数 。 在 Linux 系 
统 中 ，Exit 函数 和 _exit 函数 是 同 义 的 。 

异常 的 终止 退出 方式 有 3 种 ,分 别 是 : 

(1) 进程 运行 过 程 中 调用 了 abort 函数 。 

(2) 进程 运行 过 程 中 , 收 到 一 个 信号 并 终止 。 

(3) 进程 的 最 后 一 个 线程 对 取消 请 求 做 出 响应 。 

不 管 进程 以 哪 种 方式 退出 ,系统 最 终 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代 码 用 来 
关闭 进程 已 打开 的 文件 描述 符 ,释放 进程 所 占用 的 内 存 和 其 他 资源 。 

本 节 主 要 介绍 使 用 exit 和 _exit 终止 进程 的 方式 。 

l. exit 


exit 是 标准 C 库 中 的 一 个 库 函 数 , 其 接口 规范 说 明 如 表 4. 17 所 示 。 
54.17. exit 函数 的 接口 规范 说 明 


函数 名 称 exit 

函数 功能 正常 终止 一 个 进程 

头 文件 # include- stdlib. h> 
函数 原型 void exit(int status); 
参数 status: 程序 退出 的 状态 
返回 值 无 
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调用 exit 函数 后 , 它 将 会 做 三 件 事情 : 执行 由 atexit 与 on. exit 注册 的 所 有 函数 ; 冲 
洗 (flush)、 关 闭 所 有 打开 的 流 文件 并 删除 由 tmpfile 创建 的 文件 ;进入 内 核 代码 终 止 
程序 。 

2. Exit Wl exit 

.Exit 也 是 标准 C 库 中 的 一 个 库 函 数 , 其 接口 规范 说 明 如 表 4. 18 所 示 。 


R418 — Exit 函数 的 接口 规范 说 明 


S 


函数 名 称 _Exit 

函数 功能 正常 终止 一 个 进程 

头 文件 # include stdlib. h> 
函数 原型 void Exit(int status) ; 
参数 status: 程序 退出 的 状态 
返回 值 无 


Exit 函数 和 _exit 系统 调用 同 义 ，exit 的 接口 规范 说 明 如 表 4. 19 所 示 。 
表 4.19 — exit 函数 的 接口 规范 说 明 


函数 名 称 _exit 

函数 功能 正常 终止 一 个 进程 

头 文件 £ include unistd. h> 
函数 原型 void exit(int status) ; 
参数 status: 程序 退出 的 状态 
返回 值 无 


_Exit 和 _exit 将 会 立即 结束 进程 ,关闭 进程 打开 的 文件 描述 符 ; 系 统 会 向 该 进程 的 父 
进程 发 送 一 个 SIGCHLD 型 号 ;该 进程 的 子 进 程 将 会 被 init 进程 接收 。 

这 3 个 函数 或 系统 调用 在 使 用 时 都 能 够 正常 终止 进程 ,并 将 status 值 保留 下 来 等 待 
父 进程 读 取 。 但 _Exit、exit 和 exit 又 有 所 不 同 ,下面 通 过 示例 程序 4. 11 来 展示 _exit 和 
exit 的 不 同 。 

[示例 程序 4.11 exp. exit.c] 

# include< stdio.h> 

# include< stdlib.h> 

#include< unistd.h> 


main() 
E 
pid t pid; 
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pid fork(); 
if(pid---1) 
{ 
perror ("fork") ; 
exit(EXIT FAIIURE); 
) 
else if(pid-- 0) 
{ 
printf ("This is exit:\n"); 
printf ("now is child\n"); // 第 二 次 运行 时 删 去 \n 
_exit (EXIT SUCCESS); 
i 
else 
{ 
printf ("This is exit: Vn"); 
printf ("now is parentAn") ; // 第 二 次 运行 时 删 去 \n 
exit (EXIT SUCCESS); 


} 

编译 运行 后 ,得 到 运行 结果 如 下 : 

root@ubuntu:~ # goc exp exit.c -o exp exit 

rootGubuntu:- # ./exp exit 

This is exit: 

now is parent 

Thisis exit: 

now is child 

按照 程序 注释 的 要 求 , 去 掉 两 处 \n 后 重新 编译 运行 ,得 到 的 运行 结果 如 下 : 

root@ubuntu:~ # goc exp exit.c -o exp exit 

root&ubuntu:- # ./exp exit 

This is exit: 

nowis parent This is exit: 

比较 一 下 两 次 运行 的 结果 ,读者 会 发 现 : 在 去 掉 了 “\n" 后 ,使 用 _exit 系统 调用 的 子 
进程 并 没有 输出 “now is child”。 原 因 在 于 “now is child” 这 串 字 符 被 输出 到 了 标准 输出 
设备 的 缓冲 区 中 ,而 标准 输出 设备 是 行 缓冲 设备 ,当主 动 冲洗 或 遇 到 回 车 时 才 会 显示 在 设 
备 上 。 在 第 一 次 运行 中 ,“\n” 作 为 回 车 将 缓冲 区 中 的 内 容 显 示 在 标准 输出 设备 上 ,第 二 
次 运行 没有 了 “\n”, 并 且 使 用 的 _exit 函数 执行 时 并 不 冲洗 流 文件 的 缓冲 区 ,因此 并 未 输 
出 “now is child”。 对 于 父 进程 来 说 ,由 于 使 用 的 是 exit 函数 ,不 管 是否 有 “\n” 存 在 ,执行 
exit 函数 都 会 冲洗 流 文件 的 缓冲 区 ,因此 去 掉 “\n” 并 未 对 父 进程 的 运行 结果 产生 影响 。 

通过 以 上 示例 可 以 看 出 使 用 exit 和 _exit 对 程序 造成 的 不 同 影响 ,接着 再 来 看 看 调用 
on_exit 和 atexit 对 终止 进程 会 造成 怎样 的 影响 。 
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3. on_exit 

on exit 函数 会 为 调用 它 的 程序 注册 一 个 处 理 函 数 ,这 个 函数 将 在 该 程序 使 用 exit PR 
数 退 出 时 或 遇 到 return 语句 退出 main 函数 时 运行 。 处 理 函 数 运行 时 ,将 会 获得 on exit 
函数 和 最 后 一 次 调用 exit 函数 时 给 定 的 参数 。on_exit 函数 的 接口 规范 说 明 如 表 4. 20 
所 示 。 


表 4. 20 on_exit 函数 的 接口 规范 说 明 


函数 名 称 on exit 
函数 功能 注册 进程 正常 终止 前 的 处 理 函 数 
头 文件 # include<stdlib. h> 
函数 原型 int on_exit(void ( * func)(int , void * ) , void * arg); 
参数 func: 退出 时 的 处 理 函 数 
arg: 传递 给 func 的 参数 
in 20. dX 


示例 程序 4.12 展示 了 on. exit 函数 的 使 用 : 


[示例 程序 4.12 exp cn exit.c] 
# include< stdio.h» 
# include< stdlib.h> 


void before exit (int status,void * arg) 
t 
printf ("before exit () !\n"); 
printf ("exit $d, arg- $sWn",status, (char * Jarg); 


main() 
t 
char * str-"on exit"; 
on exit(before exit, (void * )str); 
exit (1111); 
} 
程序 编译 运行 后 结果 如 下 : 
root@ubuntu:~ # goc exp on exit.c -o exp on exit 
rootéubuntu:- # ./exp on exit 
before exit ()! 
exit status- llll,arg- cn exit 
从 运行 结果 可 以 看 出 ,exit 函数 的 参数 和 on. exit 函数 的 第 二 个 参数 被 传递 给 了 退出 
处 理 函数 ,显示 了 进程 退出 时 的 状态 和 信息 。 
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4. atexit 函数 
on exit 函数 在 Solaris(SunOS 5) 之 后 已 不 再 使 用 ,为 了 保证 程序 的 可 移植 性 , 当 需 要 注 
册 退 出 处 理 函 数 时 ,可 以 使 用 atexit 函数 来 实现 。atexit 函数 接口 规范 说 明 如 表 4. 21 所 示 。 


表 4.21 atexit 函数 的 接口 规范 说 明 


函数 名 称 atexit 

函数 功能 注册 进程 正常 终止 前 的 处 理 函 数 

头 文件 # include stdlib. h> 

函数 原型 int atexit(void ( * function)(void))， 
参数 function; 退出 时 的 处 理 函 数 
uU m 


atexit 函数 与 on. exit 功能 类 似 ,但 不 传递 参数 。 如 果 atexit 函数 注册 了 多 个 退出 处 理 
函数 ,那么 这 些 处 理 函 数 执行 时 的 顺序 与 注册 的 顺序 完全 相反 ;atexit 函数 允许 多 次 注册 同 
一 处 理 函 数 , 该 函数 也 将 被 执行 多 次 。 以 下 通过 示例 程序 4. 13 来 学 习 atexit 函数 的 使 用 。 


[示例 程序 4.13 exp_atexit.c] 
# includec stdlib.h> 

# include< stdio.h> 

# include< unistd.h> 


void bye (void) 
{ printf ("Ihis is frm bye.\n"); } 


int main (void) 
I 
inti; 
i-atexit (bye); 
if(i!=0) 
{ 
fprintf (stderr, "cannot set exit function!\n"); 
exit(EXIT FAILURE) ; 
) 
exit(EXIT SUCCESS); 
) 


编译 运行 结果 如 下 : 


rootüubuntu:- £ goc exp atexit.c -o exp atexit 
rootQubuntu:- # ./exp atexit 
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435 wait 函数 


子 进 程 调用 exit 函数 结束 后 释放 了 用 户 空间 的 资源 ,而 它 在 内 核 空 间 占用 的 资源 仍 
然 未 被 释放 ,这 时 需要 父 进 程 调用 wait 或 waitpid 函数 来 回收 子 进程 的 结束 状态 ,回收 所 
占用 的 内 核 空间 。 

1. wait 函数 

wait 函数 的 接口 规范 说 明 如 表 4. 22 所 示 。 


表 4.22 wait 函数 的 接口 规范 说 明 


函数 名 称 wait 

函数 功能 暂停 当前 进程 直至 其 子 进程 结束 ,并 取 回 子 进 程 结 束 时 的 状态 
头 文件 # include sys/wait. h> 

函数 原型 pid t wait(int * statloc) ; 

参数 statloc: 子 进程 终止 状态 的 地 址 

wa | 75 


进程 在 调用 wait 函数 后 ,将 等 待 它 的 任 一 个 子 进程 结束 , 当 某 个 子 进程 结束 时 ,wait 
函数 返回 该 子 进程 的 进程 号 ,使 用 参数 statloc 接收 子 进 程 的 结束 状态 ,并 且 回 收 该 子 进 
程 的 内 核 进程 资源 。 示 例 程序 4. 14 是 一 个 关于 wait 函数 使 用 的 例子 。 


[示例 程序 4.14 exp. wait.c] 
# includec stdio.h> 

# include< stdlib.h» 

# includec unistd.h> 


void child() 
{ 
printf ("PID $d is child\n",getpid()); 
sleep(2); 
printf ("child is exiting\n"); 
exit(EXIT SUXESS); 
) 
void parent () 
{ 
int p retum; 
p return- wait (NULL) ; 
printf ("PID $d is parent, wait return fram $d.Wn",getpid,p return); 
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if(pid« 0) 
perror ("fork"); 
else if(pid-- 0) 
child; 
else 
parent (); 
P 


编译 后 运行 得 到 如 下 结果 : 


root@ubuntu:~ # goc wait exp.c -o wait exp 

rootGubuntu:* # ./wait exp 

PID 20322 is child 

child is exiting 

PID 20321 is parent, wait return fram 20322. 

在 示例 程序 4. 14 中 ,调用 wait 函数 时 参数 为 NULL, 表 示 不 获取 子 进程 的 结束 状 
态 。 如 果 要 回收 其 终止 状态 ,statloc 参数 将 会 带 回 一 个 整 型 指针 值 ,该 指针 指向 子 进程 
的 终止 状态 。 获 得 子 进程 的 终止 状态 后 ,还 可 以 使 用 POSIX 定义 的 宏 : WIFEXITED、 
WIFSIGNALED, WIFSTOPPED 或 WIFCONTINUED 来 查看 终止 状态 的 含义 。 这 几 个 
宏 的 具体 含义 可 在 二 sys/wait.h 二 中 查找 到 。 通 过 学 习 示 例 程序 4. 15 也 可 以 让 读者 对 
子 进程 的 终止 状态 有 所 了 解 。 


[示例 程序 4.15 exp. wait2.c] 
void prt exit(int status) 
{ 
if (WIFEXITED (status) ) 
printf ("The process exited with status &d. Wn", WEXITSTATUS (status)) ; 
else 
printf ("The process is not teminated by exit. Wn"); 
$ 


int main () 
{ 
int status= 6; 
int statloc- 0, pid, returnpid; 
if((pid- fork())« 0) 
t 
perror ("fork") ; 
exit(EXIT FAILURE); 
) 
else if(pid-- 0) 
t 
exit (status); 
//abort () ; 
$ 
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编译 后 运行 结果 如 下 : 

IToot@ubuntu:~# goc wait status.c -o wait status 

root&ubuntu:^ # ./wait status 

The process exited with status 6. 

有 兴趣 的 读者 ,可 以 试 着 修改 变量 status 的 值 ,或 将 exit(status) 这 句 代码 注释 掉 , 执 
行 abort() ,看 看 程序 运行 结果 有 何不 同 。 

在 示例 程序 4. 15 中 ,只 有 一 个 子 进程 。 父 进程 由 于 调用 了 wait 函数 处 于 阻塞 状态 ， 
等 待 子 进程 结束 。 当 子 进程 结束 转换 为 僵 死 状态 时 ,内 核 会 发 送 一 个 SIGCHLD 信号 来 
唤醒 父 进程 继续 执行 wait 的 操作 ,从 而 获取 子 进 程 的 终止 状态 。 可 以 分 析 得 出 , 当 父 进 
程 有 多 个 子 进程 时 ,使 用 wait 操作 时 , 父 进程 无 法 指定 等 待 某 一 个 特定 的 子 进程 终止 ,只 
能 在 wait 调用 结束 后 ,根据 其 返回 值 来 确定 结束 的 是 哪 一 个 子 进程 。 当 程序 需要 等 待 一 
个 确定 的 子 进程 结束 时 ,可 以 使 用 waitpid 函数 来 完成 子 进程 内 核资 源 的 回收 。 

2. waitpid 函数 

waitpid 函数 的 功能 与 wait 相同 ,但 它 提供 了 一 些 更 为 灵活 的 操作 方式 ,主要 表现 在 
以 下 几 个 方面 : 

(1) waitpid 函数 可 以 等 待 一 个 特定 的 子 进程 结束 。 

(2) 父 进 程 可 以 用 非 阻 塞 的 方式 来 获取 子 进程 终止 状态 。 

(3) waitpid 支持 作业 控制 。 

waitpid 函数 调用 成 功 时 返回 终止 的 子 进程 的 进程 号 ,函数 接口 规范 说 明 如 表 4. 23 


所 示 。 
表 4.23 waitpid 函数 的 接口 规范 说 明 
函数 名 称 waitpid 
函数 功能 获取 子 进程 结束 时 的 状态 
头 文件 * include sys/wait. h> 
函数 原型 pid t waitpid(pid t pid, int * statloc, int options) ; 
pid: 指定 的 子 进 程 PID 
参数 statloc: 子 进程 终止 状态 的 地 址 
options: 控制 操作 方式 的 选项 
ni E 


在 这 里 需要 对 waitpid 的 参数 做 一 个 说 明 , 先 来 看 参数 pid, 不 同 pid 值 的 作用 如 下 : 
* pid==—1 时 ,表示 等 待 任 一 个 子 进程 结束 .此 时 waitpid 的 功能 与 wait 等 效 。 
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。 pid>0 时 ,等 待 进程 号 为 pid 的 子 进程 结束 。 

* pid— —0 时 ,等 待 与 调用 进程 同 组 的 任 一 子 进程 结束 。 

。 pid<0 时 ,等 待 组 进程 号 为 pid 绝对 值 的 任 一 子 进程 结束 。 

参数 options 可 以 进一步 控制 waitpid 函数 的 操作 ,options 可 以 设置 为 0 或 POSIX 
中 定义 的 宏 WCONTINUED、WNOHANG、WUNTRACED 按 位 “或 ”之 后 的 结果 。 这 几 
个 宏 定义 在 二 sys/wait. h 二 头 文件 中 ,WNOHANG 表示 在 等 待 子 进程 结束 的 过 程 中 , 父 
进程 不 阻塞 ,继续 运行 ;WCONTINUED 和 WUNTRACED 选项 用 于 作业 控制 。 

示例 程序 4. 16 帮助 我 们 学 习 waitpid 函数 的 使 用 。 


[示例 程序 4.16 exp. waitpid.c] 
# includec stdlib.h> 

# includec stdio.h> 

# include< unistd.h> 

# include< sys/wait.h> 


int main() 
t 
int pid; 
if((pid- fork())« 0) 
t 
perror ("fork"); 
exit(EXIT FAIIDEE); 
} 
else if(pid-- 0) 
t 
sleep); 
printf ("Now child is exiting. Wn"); 
exit(EXIT SUCCESS); 


else 


waitpid(- 1,NULL, WNOHANG) ; 
printf ("Parent is waiting child to exit. An"); 


) 
编译 后 运行 得 到 以 下 结果 : 


root&ubuntu:» $ goc exp waitpid.c -o exp waitpid 

root&ubuntu:- # ./exp waitpid 

Parent is waiting child to exit. 

root@ubuntu:~ $ Now child is exiting. 

从 运行 结果 可 以 观察 到 , 父 进程 在 调用 了 waitpid 函数 后 并 没有 进入 阻塞 状态 ,而 是 
继续 运行 了 printf 语句 ,因此 子 进程 的 输出 语句 运行 晚 于 父 进程 输出 语句 。 
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总 结 进程 的 一 生 , 可 以 把 它 比 喻 成 一 个 “自然 人 ”: 

CD. 随 着 一 句 fork, 一 个 新 进程 听 昕 落地 ,但 它 这 时 只 是 一 个 父 进程 的 克隆 体 。 

O) 随 着 eXec, 新 进程 脱胎 换 骨 , 离 家 独立 ,开始 了 自己 的 职业 生涯 。 

G) 进程 也 会 面临 死亡 。 它 可 能 是 因为 遇 到 main 函数 的 最 后 一 个 大 括号 “} "而 导致 
的 “自然 死亡 ”; 也 可 能 是 因为 调用 exit 函数 或 main 函数 内 使 用 return 而 导致 的 “自杀 ”; 
还 有 可 能 被 其 他 进程 通过 另外 一 些 方式 “谋杀 ”。 

(4)“ 自 杀 ” 的 进程 可 以 留 下 遗书 给 父 进程 , 放 在 exit 的 终止 状态 中 保留 下 来 。 

(5) 进程 死 掉 以 后 ,会 留 下 一 具 僵尸 。 此 时 ,wait 524 T 38) T." RU HER E. 
使 其 最 终归 于 无 形 。 
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Shell 是 Linux 系统 的 交互 界面 ,提供 了 用 户 与 内 核 进行 交互 操作 的 一 种 接口 。 
Linux 系统 使 用 的 Shell 类 型 为 bash。 在 一 个 打开 的 Shell 窗口 中 ,输入 用 户 名 和 密码 登 
录 之 后 ,根据 所 使 用 的 Shell 或 登录 用 户 不 同 ,Shell 窗口 中 会 出 现 不 同 的 提示 符 , 提 示 用 
户 输入 命令 。Shell 所 做 的 工作 可 以 分 为 三 大 类 : 

(1) 执行 命令 或 程序 : 接收 用 户 输入 的 命令 或 可 执行 程序 名 ,并 把 它 送 去 执行 。 

(2) 编写 程序 : 在 Shell 中 可 以 编写 后 级 为 . sh 的 脚本 程序 ,这 一 类 程序 可 以 在 Shell 
中 运行 。 

(3) 管理 输入 输出 : 管道 命令 要 实现 命令 或 程序 输入 输出 的 重 定 向 ,这 一 功能 不 是 
由 程序 本 身 实现 的 ,而 是 由 Shell 完成 的 。 

至 此 所 学 习 的 内 容 已 足够 读者 设计 一 个 简单 的 Shell, 实 现 Shell 执行 命令 或 程序 的 
功能 ,下 一 章 学 习 了 重 定向 和 管道 的 知识 后 ,可 以 继续 完善 本 章 所 设计 的 Shell。 

Shell 本 身 也 是 一 个 进程 , 它 是 一 个 无 穷 循 环 ,每 次 循环 等 待 用 户 输 入 命令 、 程 序 或 脚 
本 执行 ,使 用 exit 命令 可 以 退出 Shell。 

执行 一 条 命令 的 具体 过 程 分 为 以 下 几 个 步 又: 首先 输出 提示 符 , 提 示 用 户 输入 ;随后 
接收 用 户 输入 的 命令 ; 紧 接着 ,新 建 一 个 子 进 


开始 
程 ,来 执行 输入 的 命令 ; 子 进程 使 用 eXec 将 i 
输入 命令 加 载 到 子 进程 中 执行 ; 子 进程 生存 IER ICI Ls 
的 期 间 , Shell 进程 被 阻塞 并 等 待 子 进程 结 
东 ,流程 如 图 4. 12 所 示 。 接收 命令 
图 4.12 中 一 次 循环 的 过 程 也 可 以 用 以 1 
下 的 伪 代 码 来 描述 : 他 嫂子 进程 “三 一 一 一 ] 子 进程 
printf ("Shell 提示 符 "); 1 执行 命令 
resa A f); 等 待 子 进程 结束 
pid fork(); 1 
SEE 显示 结果 
eec dii A di); 


else if(pid» 0) 图 4.12 Shell 的 实现 流程 


wit (pid 进 程 ); 


write); 


在 这 段 伪 代 码 中 ,需要 根据 当前 登录 的 用 户 和 所 在 的 工作 目录 构造 Shell 提示 符 , 还 
需要 接收 输入 的 字符 串 ,根据 字符 串 的 内 容 确定 要 执行 的 命令 或 程序 名 、 参 数 、 选 项 等 内 


容 。 简 单 Shell 的 具体 实现 作为 本 章 的 实验 内 容留 给 读者 完成 。 


4.4 Linux 中 的 特殊 进程 


441 孤儿 进程 
如 果 一 个 进程 先 于 它 的 子 进程 结束 ,那么 这 个 子 进程 就 成 为 一 个 孤儿 进程 ,将 会 被 
init 进程 接收 ,成 为 init 进程 的 子 进程 。 编 写 程序 时 ,可 以 先 创建 一 个 进程 ,然后 让 其 父 


进程 结束 ,那么 创建 的 进程 就 变 成 了 孤儿 进程 ,如 示例 程序 4. 17 所 示 。 


[示例 程序 4.17 exqp_orphan.c] 
# include< stdio.h> 

# include< stdlib.h> 

# include< unistd.h> 

# include< sys/types.h> 


main() 


{ 


} 


pid t pid; 
if((pid- fork())--- 1) 
perror( "fork" ); 
else if(pid-- 0) 
t 
printf("pid-$d, ppid- $dWn", getpid(), getppid()); 
sleep); 
printf("pid-$d, poid- %d\n", getpid(), getppid()); 


printf( "parent process PID- $d. Wn", getpid()); 
exit(EXIT SUCCESS); 


编译 后 运行 结果 如 下 : 


rootüubuntu:- # goc orphan p.c 
root@ubuntu:~ # ./a.out 

parent pid is 2956. 

pid= 2957,ppid= 2956 
root@ubuntu:~ # pid= 2957,ppid= 1 
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从 运行 结果 能 看 到 子 进程 的 父 进程 从 原先 的 2956 变 为 1 号 进程 init (在 使 用 了 
upstart 新 型 init 系统 的 Linux 系统 中 ,这 一 示例 程序 的 运行 结果 有 可 能 会 显示 该 子 进程 
的 父 进程 是 upstart 而 非 init) ,说 明 其 父 进程 已 先 结束 ,该 进程 成 为 了 孤儿 进程 。 


442 僵尸 进程 


子 进程 先 于 父 进程 结束 时 , 子 进程 将 结束 状态 传递 给 内 核 ,之 后 子 进程 结束 ,释放 用 
户 内 存 空 间 , 但 子 进程 的 PCB 块 仍然 存放 在 内 核 空间 中 ,此 时 进程 处 于 伪 死 状态 。 子 进 
程 结束 时 系统 会 向 其 父 进程 发 送 一 个 SIGCHLD 信号 告知 父 进程 子 进程 已 结束 ; 父 进 程 
收 到 SIGCHLD 信号 后 ,如 果 使 用 wait 系统 调用 获取 子 进程 的 退出 状态 ,内 核 就 可 以 从 
内 存 中 释放 已 结束 的 子 进程 PCB 块 。 如 果 父 进程 未 使 用 wait, 则 子 进程 的 PCB 将 留 在 
系统 中 ,这 种 状态 的 子 进程 称 为 僵尸 进程 。 例 如 ,示例 程序 4. 18 就 会 产生 一 个 僵尸 进程 。 


[示例 程序 4.18 ep zmbie.c] 
# includec stdio.h> 
# include< stdlib.h> 


main() 
t 
pid t pid; 
if((pid- fork())==- 1) 
perror ("fork") ; 
else if(pid-- 0) 
t 
printf ("child process %d will beoame a zanbie! Wn",getpid()) ; 
exit(EXIT SUXESS); 
) 
sleep(2); 
system("ps u"); 
exit(EXIT SUCCESS); 


USER PID $CPU $MM VSZ RSS TIY STAT START TME COMMAND 


root 2860 0.0 0.4 8600 4920pts/l Ss 21:08  0:00bash 

root 2987 0.0 0.0 2008  564pts/1 S+ 21:13 0:00 ./a.out 

root 2988 0.0 0.0 0 Opts/l Z+ 21:13 0:00 [a.out] < defunct> 
root 2989 0.0 0.0 2272 624pta/l S+ 21:13 0:0sh-cpsu 

root 2990 0.0 0.2 6656 2356pts/] R+ 21:13 0:00psu 


程序 运行 时 的 输出 可 以 看 到 创建 的 子 进 程 ID 57g 2988." ps u" 命 令 显示 的 结果 表明 
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2988 号 进程 的 状态 为 Z 十 ,表明 这 是 一 个 僵尸 进程 。 


在 实际 程序 设计 开发 中 ,应 该 避免 僵尸 进程 的 产生 。 为 避免 产生 僵尸 进程 ,通常 可 以 
采取 以 下 的 方法 : 

CD 将 父 进程 中 对 SIGCHLD 信号 的 处 理 函 数 设 为 SIG_IGN( 忽 略 信号 ) ,让 内 核 清 
理 这 些 子 进程 ; 

(2) fork 两 次 并 杀 死 一 级 子 进程 , 令 二 级 子 进程 成 为 孤儿 进程 而 被 init 接收 和 清理 。 


443 守护 进程 


守护 进程 (Deamon) 是 类 UNIX 系统 中 一 类 特殊 的 进程 ,也 称 为 精灵 进程 。 通 常 在 
系统 自 举 时 启动 ,关闭 时 终止 。 守 护 进程 通常 周期 性 地 执行 某 种 任务 或 等 待 处 理 某 些 发 
生 的 事件 ,Linux 的 大 多 数 服务 器 就 是 用 守护 进程 实现 的 ,例如 init 进程 .crond 进程 等 。 

守护 进程 具有 一 些 区 别 于 其 他 进程 的 特点 : 运行 在 后 台 ; 独 立 于 控制 终端 ;执行 日 常 
事务 。 

尽管 大 多 数 守 护 进 程 都 以 超级 用 户 特权 运行 ,但 普通 用 户 在 设计 程序 时 ,同样 可 以 将 
需要 长 期 周期 性 执行 固定 操作 的 进程 设置 为 守护 进程 ,通常 可 以 使 用 这 种 方式 来 建立 
Linux 系统 中 的 服务 器 软件 。 本 节 内 容 为 读者 介绍 如 何 建立 一 个 守护 进程 ,该 守护 进程 
具体 要 完成 的 功能 可 由 读者 自行 定义 。 

以 下 步骤 可 以 建立 一 个 守护 进程 。 

CD 屏蔽 一 些 有 关 控 制 终端 的 信号 。 

守护 进程 是 运行 于 后 台 ,脱离 控制 终端 的 ,在 它 尚未 建立 并 且 脱 离 终端 之 前 ,要 预防 
遭受 控制 终端 的 干扰 导致 退出 或 挂 起 。 此 时 ,可 使 用 代码 "signal (SIGHUP, SIG _ 
IGN);”, 该 语句 代码 将 使 调用 进程 屏蔽 导致 挂 起 信号 ,代码 中 使 用 signal 函数 将 指定 信 
号 SIGHUP 的 处 理 方式 修改 为 忽略 信号 (SIG_IGN) 。 关 于 信和 号 的 内 容 将 在 后 面 的 章节 
中 讲解 。 

(2) 将 文件 创建 模式 掩 码 设置 为 0。 

创建 守护 进程 时 会 经 历 多 次 fork 操作 ,从 其 父 进程 继承 来 的 文件 创建 模式 掩 码 , 有 
可 能 会 导致 子 进程 无 法 读 写 文 件 , 因 此 需要 重 设 文件 创建 模式 掩 码 ,将 掩 码 设置 为 0。 

(3) 调用 fork, 然 后 使 父 进程 退出 。 

守护 进程 有 可 能 是 以 命令 的 方式 在 Shell 环境 中 创建 的 ,调用 fork 创建 子 进程 ,使 父 
进程 退出 ,可 以 让 Shell 认为 这 条 命令 已 经 执行 完毕 ,因此 可 以 继续 接收 下 一 条 命令 来 执 
行 。 创 建 子 进程 的 另 一 个 原因 是 守护 进程 是 脱离 控制 终端 的 ,只 有 创建 子 进程 才能 保证 
实现 守护 进程 功能 的 不 是 组 长 进程 ,从 而 可 以 使 用 setsid 函数 创建 新 会 话 , 使 调用 进程 脱 
离 前 台 进 程 组 。 具 体 使 用 的 代码 如 下 : 


pid- fork(); 
if(pid» 0) 
exit(EXIT SUXESS); 


(4) 创建 新 会 话 , 脱 离 控制 终端 和 进程 组 。 
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在 上 一 步 的 基础 上 ,调用 setsid 函数 使 子 进程 成 为 新 的 会 话 首 进程 。 

(5) 禁止 进程 重新 打开 控制 终端 。 

作为 会 话 首 进 程 ,尽管 当前 进程 运行 在 后 台 , 但 仍然 可 以 获得 与 控制 终端 的 联系 。 为 
保证 进程 不 会 重新 打开 终端 ,可 以 再 次 调用 fork 创建 子 进程 ,让 父 进 程 退出 ,使 保留 的 进 
程 并 非 进 程 组 长 ,从 而 无 法 获取 与 控制 终端 的 联系 。 

(6) 改变 当前 工作 目录 。 

守护 进程 通常 都 是 长 时 间 和 运行 的 ,其 工作 目录 是 从 父 进程 继承 而 来 的 ,所 以 当 守 护 进 
程 活动 时 ,会 导致 其 工作 目录 所 在 的 文件 系统 不 能 印 载 。 为 了 保证 文件 系统 能 够 正常 工 
ME ,通常 需要 将 守护 进程 的 工作 目录 切换 到 根 目 录 。 可 使 用 代码 “chdir("/");? 来 实现 这 
一 步骤 。 

CD 关闭 不 需要 的 文件 描述 符 。 

守护 进程 脱离 终端 运行 ,因此 不 需要 和 标准 L/O 文件 通信 。 除 此 之 外 ,未 关闭 的 文 
件 描述 符 也 有 可 能 造成 文件 系统 无 法 印 载 等 问题 。 因 此 在 创建 守护 进程 时 ,需要 关闭 不 
使 用 的 文件 描述 符 。 

(8) 将 文件 描述 符 STDIN_FILENO, STDOUT_FILENO, STDERR_FILENO 和 
/dev/null 相连 接 。 

某 些 守护 进程 需要 打开 /dev/null 与 文件 描述 符 0、1、2 相连 接 。 这 样 ,即使 在 守护 进 
程 中 使 用 的 某 个 库 例 程 试图 读 标准 输入 、 写 标准 输出 和 标准 错误 ,也 都 不 会 产生 任何 效果 
和 错误 。 可 采用 的 代码 如 下 : 


open ("/dev/null",O RDONLY) ; 
cpen("/dev/null",O RDWE); 
cpen("/dev/null",O RDWE); 


经 过 以 上 步骤 ,将 可 以 得 到 一 个 守护 进程 ,完整 的 代码 如 下 : 


[示例 程序 4.19 ep_deamcn.c] 
# include< stdio.h» 

# include< stdlib.h» 

# include< unistd.h> 

# include< signal .hy 

# include< fentl.h» 

# include< sys/syslog.h» 

# include< sys/param.h» 

# include< sys/types.h» 

# includec sys/stat.h» 


void init deamon(const char * amd, int para) 
1 

int pid; 

inti; 

signal (SIGHUP, SIG IGN); 


umask (0) ; 


if((pid- fork())> 0) 
exit(EXIT SUXESS); 
else if (pid 0) 
t 
perror ("forkl") ; 
exit(EXIT FAIRE); 
} 
setsid(); 


if((pid- fork())> 0) 
exit(EXIT SUCCESS); 
else if (pid« 0) 
t 
perror ("fork2") ; 
exit(EXIT FAILURE); 
} 
chdir("/"); 


for (i= 0;i< NOFIIE;i* + ) 


close(i); 


cpen("/dev/null",O RDONLY) ; 


open ("/dev/nill",O RUWR); 
open ("/dev/nill",O RUWR); 


penlog (amd, IOG PID,para); 
retum; 


main(int argc,char * argv[]) 


1 


time t ticks; 


init deamon (argv [0], LOG KEEN); 


while(1) 
{ 
sleep(3); 
ticks- time (NULL) ; 


Syslog(IOG INEO, "$s",asctime (localtime (&ticks))); 
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444 出 错 记 录 


由 于 守护 进程 脱离 控制 终端 ,所 以 守护 进程 运行 过 程 中 产生 的 错误 无 法 输出 到 标准 
设备 上 。 在 记录 守护 进程 日 志 信息 时 , 既 不 希望 所 有 守护 进程 把 出 错 信息 都 写 到 工作 站 
的 控制 台 设备 上 ,也 不 希望 每 个 守护 进程 将 自己 的 出 错 信 息 写 到 一 个 单独 的 文件 中 。 因 
此 需要 使 用 一 个 集中 的 守护 进程 出 错 记录 设施 来 处 理 守护 进程 产生 的 日 志 。 

大 多 数 守 护 进 程 使 用 的 是 BSD syslog 设施 ,其 组 织 结构 如 图 4. 13 所 示 。 完 整 的 
syslog 日 志 中 包含 产生 日 志 的 程序 模块 (facility) 、 严 重 性 (severity 或 level) 时间 EUL 
名 或 IP、 进 程 名 、 进 程 ID 和 正文 。 在 类 UNIX 操作 系统 中 ,能 够 按 facility 和 severity 的 
组 合 来 决定 什么 样 的 日 志 消 息 需要 记录 、 记 录 到 什么 地 方 、 是 否 需要 发 送 到 一 个 接收 
syslog 的 服务 器 等 。 


写 入 文件 或 日 记 用 户 进程 ， 
或 者 发 送 给 其 他 主机 


4 
用 户 进程 syslogd 
i 
syslog 
Rin | Le = cR 
| /dev/log UDP port 514 /dev/klog f 
1 I 
! UNIX 域 5 i 
| OMEREEF —— nERT wef | 
| i 
1 I 
| n 内 核 例 程 ! 
————— E, E AB J 
TCP/IP 网 络 


图 4.13 syslog 设施 的 结构 示意 


从 示例 程序 4. 19 中 可 以 看 到 ,在 编写 守护 进程 时 ,可 以 使 用 openlog syslog 和 closelog 
来 使 用 这 套 设施 。 这 三 个 函数 的 接口 规范 说 明 如 表 4. 24、 表 4. 25 和 表 4. 26 所 示 。 


表 4.24 openlog 函数 的 接口 规范 说 明 


函数 名 称 openlog 

函数 功能 打开 日 志文 件 

头 文件 # include- syslog. h> 

函数 原型 void openlog(const char * ident, int option, int facility) ; 
ident; 日 志 的 标记 

参数 option: 选项 
facility: 说 明 如 何 处 理 来 自 不 同 设施 的 日 志 

返回 值 无 


表 4.25 syslog 函数 的 接口 规范 说 明 
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函数 名 称 syslog 

函数 功能 产生 一 个 日 志 消 息 

头 文件 # include<syslog. h> 

函数 原型 void syslog(int priority. const char * format, ++); 

参数 priority: 日 志 的 紧急 程度 

format: 日 志 中 信息 的 格式 
返回 值 无 
表 4. 26 closelog 函数 的 接口 规范 说 明 

函数 名 称 closelog 函数 原型 void closelog( void) ; 
函数 功能 关闭 日 志文 件 参数 无 
头 文件 #include<syslog. h> 返回 值 无 


调用 openlog 函数 是 一 个 可 选 的 步骤 ,如 果 没 有 调用 openlog 的 话 ,在 第 一 次 调用 
syslog 函数 时 ,会 自动 调用 openlog。 
在 调用 openlog 函数 时 ,可 以 指定 一 个 ident, 这 个 标记 将 会 被 加 至 每 则 日 志 消息 中 ， 
通常 ident 会 设置 为 守护 进程 的 程序 名 。option 选项 可 以 选择 使 用 宏 LOG. PID;LOG _ 
PERROR .LOG_NOWAIT 等 ,各 宏 的 具体 含义 可 以 在 syslog. h 文件 中 查找 到 。facility 
参数 可 选 的 宏 也 可 以 在 syslog. h 文件 中 查找 到 ,设置 facility 参数 的 目的 是 可 以 让 配置 


文件 说 明 来 自 不 同 设施 的 消息 将 以 不 同 的 方式 进行 处 理 。 


调用 syslog 函数 时 ,如 果 之 前 没有 调用 openlog ,那么 priority 可 以 设置 为 level 和 
facility 的 组 合 。format 参数 和 其 他 参数 将 会 传递 给 vsprintf 函数 进行 格式 化 输出 。 
例如 ,在 上 一 节 的 程序 中 使 用 了 openlog 和 syslog 函数 ,代码 如 下 : 


cpenlog (amd, 10G PID,para) ; 


while(1) 
t 
sleep(3); 


ticks- time (NULL) ; 
syslog(IOG INEO, "$3", asctime (localtime (&ticks))); 


) 


其 中 para 值 为 LOG_KERN ,cmd 值 为 守护 进程 程序 名 exp_deamon。 以 上 代码 将 在 日 志 
文件 中 每 隔 3 秒 记 录 一 条 日 志 信息 ,信息 包括 程序 名 、 进 程 PID 号 、 时 间 , 类 型 为 内 核 产 


生 的 信息 性 消息 。 


Lnx 环 境 高 级 程序 设计 


4.5 小 结 


进程 是 操作 系统 中 一 个 非常 重要 的 概念 ,在 Linux 环境 下 编写 系统 级 程序 需要 熟练 
掌握 进程 的 属性 和 操作 。 

本 章 首先 介绍 了 Linux 环境 下 可 执行 程序 和 进程 的 结构 ,并 且说 明了 两 者 之 间 的 关 
系 。 在 Shell 环境 下 ,可 以 使 用 ps、pstree、top 等 命令 来 查看 进程 的 情况 。 进 程 在 运行 过 
程 中 还 会 使 用 到 很 多 环境 参数 ,这 些 参数 都 会 影响 到 程序 的 运行 。 

本 章 还 介绍 了 一 些 必须 熟练 掌握 的 函数 ,它们 是 fork, eXec, wait, waitpid 和 exit, 这 
些 函 数 是 Linux 环境 下 编写 程序 经 常会 使 用 到 的 函数 ,读者 可 以 使 用 这 些 函 数 创建 自己 
的 简单 Shell 环境 。 

在 本 章 最 后 ,介绍 了 孤儿 进程 .僵尸 进程 这 两 种 特殊 的 进程 ,在 编写 程序 时 ,要 注意 这 
两 种 进程 造成 的 影响 。 本 章 还 介绍 了 如 何 创建 守护 进程 ,守护 进程 是 一 种 用 于 实现 服务 
器 软件 的 方法 。 


习 题 


一 、 填空 题 
1. 在 Linux 中 ,进程 的 控制 块 是 一 个 类 型 名 为 的 结构 体 。 
2. 在 Linux 环境 下 ,进程 的 两 种 运行 模式 为 — mH 
3. 在 Linux 的 用 户 空间 中 ,创建 一 个 新 进程 的 方法 是 由 菜 个 已 经 存在 的 进程 调用 
或 函数 ,被 创建 的 新 进程 称 为 ,已 存在 的 进程 称 为 

A. 就 绪 态 的 进程 是 一 个 只 需要 资源 即 可 运行 的 进程 。 

5. 进程 结束 时 可 以 调用 exit、exit abort 三 个 函数 ,其 中 属于 异常 结束 进 
程 的 方法 。 

6. 某 进程 调用 wait 函数 后 ,如 果 该 进程 没有 子 进程 , 则 该 进程 将 

7. 产生 僵尸 进程 的 要 素 是 : ~ ;产生 孤儿 进程 的 要 素 是 : 

8. 调用 fork 函数 后 在 父 进程 中 返回 ,在 子 进程 中 返回 

二 、 简 答题 

1. 列 出 你 的 系统 中 当前 所 有 正在 运行 的 守护 进程 ,简要 说 明 其 功能 。 

2. 请 简 述 在 Linux 系统 中 进程 状态 是 如 何 转换 的 。 

3. 请 简 述 终端 会话、 进程 组 和 进程 之 间 的 关系 。 

三 、 编程 题 

1. 编写 一 个 程序 ,程序 中 创建 一 个 子 进程 用 来 打开 你 的 Linux 系统 中 的 浏览 器 ; 父 
进程 等 待 子 进程 结束 后 输出 子 进程 的 退出 值 。 

2. 编写 一 个 程序 ,创建 一 个 僵尸 进程 并 用 ps 命令 显示 该 进程 的 状态 。 

3. 编写 一 个 程序 ,创建 一 个 孤儿 进程 并 用 ps 命令 显示 该 进程 的 状态 。 
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重 定向 与 管道 


在 Linux 系统 中 ,系统 会 默认 为 命令 或 程序 打开 三 个 标准 L/O 文件 ,保证 命令 或 程 
序 可 以 与 用 户 进行 交互 。 除 此 之 外 ,还 可 以 将 这 三 个 标准 文件 重 定向 , 借 此 可 以 实现 从 指 
定 的 位 置 获取 输入 信息 或 将 输出 信息 、 错 误 信息 保存 在 指定 的 文件 中 。 同 时 ,Linux 系统 
还 提供 管道 的 功能 ,可 以 将 多 条 命令 或 程序 之 间 的 输出 和 输入 相 衔接 ,实现 灵活 的 Shell 
编程 。 


5.1 重 定向 和 管道 命令 


511 重 定向 命 


所 有 的 UNIX 1/0 重 定向 都 是 基于 标准 数据 流 的 原理 。 在 Shell 中 键入 命令 运行 
时 ,内 核 将 会 为 命令 进程 打开 三 个 标准 1/0 设备 文件 ,并 且 用 文件 描述 符 0、1、2 与 它们 关 
联 , 其 中 文件 描述 符 0 对 应 标准 输入 设备 ,1 对 应 标准 输出 设备 ,2 对 应 标准 错误 文件 。 进 
程 在 运行 过 程 中 ,默认 从 标准 输入 设备 文件 读 取 数 据 , 将 输出 数据 写 入 标准 输出 设备 文 
件 , 如 果 出 错 的 话 , 错 误 信 息 将 会 写 人 标准 错误 文件 。 例 如 ,使 用 cat 命令 时 ,系统 将 会 把 
结果 显示 在 标准 输出 设备 上 。 通 常 标准 输入 设备 文件 为 键盘 ,标准 输出 设备 文件 和 标准 
错误 文件 为 显示 器 ,如 图 5. 1 所 示 。 


内 核 
stderr 


stdout 


5.1 进程 和 标准 设备 文件 的 联系 


在 某 种 情况 下 ,用 户 希 望 能 够 将 信息 输出 到 某 个 文件 中 ,而 不 是 显示 在 标准 输出 设备 
上 ,此 时 可 以 将 该 进程 的 标准 输出 进行 重 定向 。 重 定向 命令 分 为 输入 重 定向 输出 重 定向 
和 错误 重 定向 。 
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1. 输入 重 定向 
输入 重 定向 使 用 符号 “一 ”来 表示 , 它 表 示 将 进程 的 文件 描述 符 0 关联 到 指定 的 文件 
上 去 。 输 入 重 定向 命令 的 格式 为 : 


Command <file 


例如 ,命令 mail -s test hr@163. com — file 就 是 一 条 输入 重 定向 命令 , 它 表示 以 file 
文件 为 邮件 内 容 , 向 hr@163. com 邮箱 发 送 一 封 标题 为 test 的 邮件 。 使 用 “二 ”符号 时 ， 
也 可 以 把 文件 描述 符 0 加 在 前 面 ,例如 ,cat 0 二 filel ,该 命令 同样 表示 将 cat 命令 的 输入 重 
定向 到 filel 文件 。 

2. 输出 重 定向 

符号 “二 ”或 “二 二 ”都 可 以 用 来 表示 输出 重 定向 ,两 者 的 差异 在 于 .: 前 者 以 覆盖 的 方 
式 输出 ,后 者 以 追加 的 方式 输出 。 输 出 重 定向 命令 的 格式 为 : 

omand file 或 omand > file 


例如 ,命令 cat filel file2>file3 表示 将 文件 filel 和 file2 的 内 容 合并 输出 到 文件 file3 
中 ,这 条 命令 也 可 以 使 用 以 下 两 条 命令 来 蔡 换 : 

cat filel> file3 

cat file2> > file3 


如 果 重 定向 使 用 的 是 符号 “之 !”, 那 么 表示 输出 重 定向 强制 覆盖 文件 原 有 的 内 容 。 

3. 错误 重 定向 

错误 重 定 向 可 以 使 用 符号 "2 二 "或 “2 二 二 "来 表示 ,两 个 符号 的 差异 与 输出 重 定向 类 
似 。 错 误 重 定向 的 具体 命令 格式 为 : 

omand 2>file 或 comem D> file 

使 用 错误 重 定 向 后 ,如 果 在 命令 执行 的 过 程 中 有 错误 发 生 ,错误 信息 将 会 记录 在 文件 
file 中 。 

除了 以 上 介绍 的 重 定向 符号 外 ,还 可 以 使 用 “二 &”“1 二 ”2 二 &&1” 等 符号 。 使 用 重 定 
向 符号 时 ,也 并 不 仅 限 于 只 能 在 命令 末尾 处 出 现 重 定向 符号 。 这 些 重 定 向 符号 可 以 单独 
使 用 ,也 可 以 组 合 使 用 ,例如 : 


wc < filel > result.wc 2» error.txt 


以 上 命令 表示 统计 filel 文件 的 字符 .单词 和 行 数 ,将 结果 记录 在 result. wc 文件 中 ， 
如 果 出 错 ,错误 信息 记录 在 error. txt 文件 中 。 


512 管道 命 


如 果 某 些 数据 必须 要 经 过 几 次 命令 操作 之 后 才能 得 到 所 想 要 的 结果 ,此 时 可 以 使 用 
管道 符号 将 这 些 命令 连接 起 来 。 管 道 命令 会 将 符号 先后 的 命令 连接 起 来 ,将 前 一 条 命令 
的 输出 作为 后 一 条 命令 的 输入 。 符 号 “1” 称 为 管道 操作 符 ,管道 命 令 的 具体 格式 如 下 : 
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grep root /etc/passw | sort 


该 命令 表示 在 /etc/passwd 文件 中 搜索 出 


含有 root 的 内 容 , 并 将 这 些 内容 排 序 。 这 条 管 “| Bep 进 各 son 进 各 
道 命令 的 示意 图 如 图 5. 2 所 示 。 stdout Dmm stdin 
又 如 ， 


图 5.2 管道 命令 示意 图 
1s -l|grep hr| lpr 


该 命令 表示 列 出 当前 目录 中 包含 hr 模式 串 的 文件 名 称 ,将 结果 打印 出 来 。 
5.2 实现 重 定向 


521 重 定向 的 实施 者 
在 实现 重 定向 命令 之 前 ,需要 借 由 一 个 示例 程序 先 来 明确 一 下 重 定向 是 由 待 执 行 的 
命令 或 程序 还 是 Shell 来 实现 的 。 


[示例 程序 5.1 for redirect.c] 
# include< stdio.h» 
main(int argc, char * argv[ ]) 
t 
inti; 
char buf [80]; 
scanf ("$3",buf) ; 
printf ("info frm file:$3 Wn", buf) ; 
printf ("arg listWn"); 
for (i- 0;i«argc;it * ) 
printf ("argv [$d] :$3WVn", i, argv[i]); 
fprintf (stderr, "Where do you find this2\n"); 
) 
在 示例 程序 5. 1 中 ,分 别 使 用 scanf printf 和 fprintf 函数 对 标准 输入 、 标 准 输出 和 标 
准 错误 文件 进行 了 读 、 写 操作 ,并 且 还 使 用 printf 函数 输出 了 执行 程序 时 所 附带 的 参数 。 
当 使 用 两 种 不 同 的 方式 来 运行 该 程序 时 ,请 观察 一 下 重 定向 符号 是 否 会 被 Shell 当 作 参 
数 传递 给 用 户 程序 。 
将 程序 编译 后 按照 带 重 定向 和 不 带 重 定向 两 种 方式 运行 ,得 到 结果 如 下 : 


root@ubuntu:~ # ./for redirect paral para? para3 
Hello J 

info fram file:Hello 

arg list 
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argv[0]:./for redirect 

argv[1]:paral 

argv[2] :para2 

argv[3] :para3 

where do you find this? 

root@ubuntu:~ # ./for redirect paral para? para3» result 2» err.txt 

Hello J 

root8ubuntu:- f cat result 

info fram file:Hello 

arg list 

argv[0]:./for redirect 

argv[1] :paral 

argv [2] :Para2 

argv [3] :para3 

rootGubuntu:^ # cat err.txt 

where do you find this? 

从 程序 两 次 运行 的 输出 结果 来 看 ,输出 的 参数 中 并 没有 重 定向 符号 和 文件 名 称 , 因 此 
可 以 确定 : 重 定向 并 不 是 由 命令 或 用 户 程序 实现 的 ,而 是 由 Shell 实现 的 。 因 此 可 以 明 
确 : 要 实现 重 定向 命令 ,就 需要 改写 第 4 章 所 编写 的 简单 Shell 程序 ,在 Shell 执行 命令 之 
前 添加 实现 重 定向 的 功能 。 


522 实现 重 定向 的 前 提 条 件 


当 着 手 设 计 带 有 重 定向 功能 的 Shell 程序 时 ,还 要 着 记 : 之 所 以 能 够 实现 重 定向 ,是 
因为 Linux 环境 具有 以 下 几 个 特性 : 

(1) 系统 为 每 个 进程 所 打开 的 标准 L/O 设备 文件 对 应 着 值 最 小 的 三 个 文件 描述 符 
0、1、.2。 实 际 上 一 个 进程 打开 的 所 有 文件 的 信息 是 储存 在 一 个 结构 体 数 组 之 中 的 ,而 打开 
文件 对 应 的 文件 描述 符 就 是 该 文件 信息 在 结构 体 数 组 中 的 存储 位 置 , 即 数组 的 下 标 。 

(2) 当 进 程 使 用 open、dup 等 文件 操作 时 .新 分 配 的 文件 描述 符 遵循 最 低 可 用 文件 描 
述 符 原则 。 即 当 打 开 一 个 文件 时 ,系统 为 此 文件 安排 的 文件 描述 符 总 是 可 用 的 文件 描述 
符 中 值 最 小 的 那 一 个 。 

G) 在 一 个 进程 中 ,如 果 在 文件 打开 操作 以 后 使 用 了 eXec 族 函 数 ,那么 eXec 函数 将 
不 会 影响 执行 前 打开 的 文件 描述 符 集合 。 

523 dp 和 dre 

dup 和 dup2 是 在 Linux 中 实现 重 定向 命令 时 经 常会 使 用 到 的 两 个 函数 。 两 者 都 可 

用 于 复制 文件 描述 符 ,dup 函数 的 接口 规范 说 明 如 表 5. 1 所 示 。 
表 5.1 dup 函数 的 接口 规范 说 明 


函数 名 称 dup 
函数 功能 复制 一 个 文件 描述 符 


续 表 
头 文件 # include unistd. h> 
函数 原型 int dup(int oldfd); 
参数 oldfd: 被 复制 的 文件 描述 符 
返回 什 二 一 1: 复制 成 功 ,返回 新 的 文件 描述 符 


一 1: 出 错 


dup 函数 用 来 复制 一 个 文件 描述 符 , 参 数 oldfd 指向 一 个 打开 的 文件 ,函数 的 返回 值 
返回 复制 后 的 新 文件 描述 符 ,新 的 文件 描述 符 也 指向 oldfd 所 指向 的 文件 列表 项 ,如 
图 5. 3 所 示 , 如 果 该 进程 没有 打开 其 他 文件 ,那么 在 执行 了 dup(0) 之 后 ,文件 描述 符 3 将 


会 指向 0 所 对 应 的 文件 。 


程 
task struct 


files 


打开 的 文件 

描述 符 列表 struct. file 文件 信息 

-LorT- 文件 读 写 位 置 VEA 
i 文件 状态 标志 i TEES 
3 文件 V 节 点 信息 E 


5.3 dup(0) 后 文件 描述 符 的 关系 


dup2 也 可 用 于 复制 文件 描述 符 , 它 与 dup 的 不 同 之 处 在 于 ,dup2 可 以 指定 要 把 信息 
复制 给 哪 一 个 文件 描述 符 。dup2 函数 的 接口 规范 说 明 如 表 5.2 所 示 。 
表 5.2 dup2 函数 的 接口 规范 说 明 


函数 名 称 dup2 
函数 功能 复制 一 个 文件 描述 符 
头 文件 # include unistd. h> 
函数 原型 int dup2(int oldfd, int newfd) ; 
参数 oldfd: 被 复制 的 文件 描述 符 
newíd: 新 的 文件 描述 符 
返回 什 > 一 1: 复制 成 功 , 返 回 新 的 文件 描述 符 


一 1: 出 错 


说 明 : dup2 在 复制 文件 描述 符 时 ,如 果 newfd 已 分 配给 某 个 打开 的 文件 ,那么 系统 
会 先 关闭 newfd, 切 断 与 原先 文件 的 联系 ,然后 再 进行 复制 。 
示例 程序 5.2 说 明了 如 何 使 用 dup 和 dup2 来 复制 文件 描述 符 。 


[示例 程序 5.2 exp dup.c] 


# include stdio.h> 
# include< unistd.h» 
# include stdlib.h» 
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# includec fcnt1.h> 


int fa,fal,fa27 
char buf [10]; 
fd open ("text .txt",O RDONLY) ; 
if(fd« 0) 
t 
perror ("open") ; 
exit(EXIT FAILURE) ; 
} 
fdl- dup (fd) ; 
if(fdl« 0) 
{ 
perror ("dup") ; 
exit(EXIT FAILURE); 
) 
fd2- dx? (3,5) ; 
if(fa2« 0) 
i 
perror ("dup2") ; 
exit(EXIT FAILIFE); 
) 
if (read (fd, buf, 10)» 0) 
write(STDOUT FIIENO,buf, 10) ; 
if (read(fdl,buf, 10) » 0) 
write(STDOUT FILENO,buf, 10) ; 
if (read(fd2,buf, 10)» 0) 
write (STDOUT FILENO,buf, 10) ; 
close (fd); 
close (fdl); 
close (fd2); 
i 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # cat text.txt 
This is a test text, 

Can you see my greeting? 
root(ubuntu:^ # ./exp dup 
This is a test text, 

Can you s 


从 运行 结果 可 以 看 出 ,fd 通过 open 函数 分 配给 了 文件 text. txt, 文 件 描述 符 fdl 和 
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fd2 都 复制 了 fd, 因 此 三 个 文件 描述 符 指向 同一 个 文件 。 尽 管 fd、fdl 和 fd2 是 三 个 不 同 
的 文件 描述 符 , 但 它们 使 用 的 是 同一 个 打开 的 文件 表 项 (struct file)。 因 此 不 管 通过 哪个 
文件 描述 符 改变 了 文件 读 写 指针 的 位 置 ,都 会 对 其 他 两 个 文件 描述 符 造 成 影响 。 从 这 个 
示例 的 运行 结果 也 能 够 看 到 ,输出 结果 并 不 是 三 次 从 头 开始 的 10 个 字符 ,而 是 从 头 开始 
连续 的 30 个 字符 。 


524 重 定向 的 三 种 方法 


通过 上 一 节 的 学 习 , 可 以 分 析出 实现 重 定向 的 流程 : 0、1、2 三 个 文件 描述 符 原先 是 
与 标准 L/O 设备 文件 关联 的 ,需要 重 定向 时 ,可 以 使 用 open, dup 或 dup2 等 函数 将 文件 
描述 符 0,1 或 2 与 指定 的 重 定向 文件 相关 联 , 这 样 就 可 以 实现 标准 IO 设备 文件 的 重 定 
向 。 在 Linux 系统 中 ,可 以 使 用 三 种 方法 来 实现 重 定向 功能 ,分 别 是 : 
close then open: 关闭 指定 的 标准 L/O 设备 文件 ,打开 重 定向 文件 。 
open close dup close: 打开 重 定向 文件 ,关闭 指定 的 标准 L/O 设备 文件 ,复制 重 定 
向 文件 的 文件 描述 符 ,关闭 第 一 步 打开 的 文件 描述 符 。 
open dup2 close; 打开 重 定向 文件 ,将 指定 的 标准 L/O 设备 文件 描述 符 作为 参数 ， 
复制 重 定向 文件 的 文件 描述 符 ,关闭 第 一 步 打开 的 文件 描述 符 。 

针对 以 上 三 种 重 定向 的 方法 ,我 们 来 一 一 讲解 。 

1. close then open 

在 这 种 方法 中 ,程序 调用 close 函数 关闭 指定 的 文件 描述 符 与 标准 设备 文件 的 联系 ， 
此 时 该 文件 描述 符 就 处 于 空闲 可 分 配 状态 ;随后 使 用 open 函数 打开 指定 的 重 定向 文件 ， 
由 于 open 遵循 最 低 可 用 文件 描述 符 原则 ,打开 的 文件 将 获得 第 一 步 操作 释放 出 来 的 文件 
描述 符 。 示 例 程 序 5. 3 实现 了 将 标准 输入 重 定向 : 


[示例 程序 5.3 esp_redirect1.c] 
# includec stdio.h» 
# includec stdlib.h» 
# includec fcntl.h» 
main() 
t 
int fd; 
char buf [80]; 
close(0); 
if((fd- open("./text.txt",O RDONLY)) != 0) 
t 
perror ("open"); 
exit(EXIT FAILURE); 
) 
read (0,buf, 80) ; 
write (1, buf, 80) ; 
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该 程序 将 标准 输入 重 定向 到 当前 目录 中 的 text. txt 文件 ,从 中 读 取 80 个 字 节 的 数 


据 , 输 出 在 标准 输出 设备 上 。 文 件 描述 符 0 关联 的 文件 变化 情况 如 图 5.4 所 示 。 


2. open close dup close 

这 种 方法 首先 使 用 open 函数 打开 指定 的 重 
定向 文件 ,获取 该 文件 的 文件 描述 符 fd; 随 后 ,使 
用 close 函数 关闭 标准 1/0 文件 ,释放 其 对 应 的 
文件 描述 符 ;之 后 使 用 dup 函数 复制 fd, 此 时 由 
于 dup 函数 遵循 最 低 可 用 文件 描述 符 原则 ,因此 
将 会 把 fd 复制 给 第 二 步 中 close 释放 出 来 的 文件 
描述 符 ; 最 后 使 用 close 关闭 fd 即 可 。 示 例 程序 


5.4 使 用 第 二 种 方法 来 实现 重 定 向 ,其 功能 和 示例 程序 5. 3 — FE ,将 输入 重 定向 到 当前 目 


录 中 的 text. txt 文件 上 。 


[示例 程序 5.4 exp. redirect2.c] 
main() 
( 
int fd,newfd; 
char buf [80]; 
fd- open (". /text.txt ",O RDONLY) ; 
close(0); 
newfd- dup (fd) ; 
if (newfd!= 0) 
{ 
Perror ("dp"); 
exit(EXIT FAILURE); 
) 
close (fd); 
read (0,buf, 80) ; 
write(l,buf,80); 
) 


text.txt 


fd:0 x stdin 


进程 fd:1 


H stdout 


fd:2 j stderr 


图 5.4 close then open 方法 的 示意 图 


在 这 个 示例 程序 中 ,文件 描述 符 关联 文件 的 变化 情况 如 图 5. 5 Bron 


3. open dup2 close 


这 种 方法 与 open close dup close 方法 类 似 ,不 同 之 处 在 于 ,使 用 dup2 将 open close 
dup close 方 法 的 第 二 步 和 第 三 步 合 而 为 一 ,直接 关闭 了 标准 L/O 文件 并 进行 了 文件 描述 


符 的 复制 。 示 例 程序 5. 5 为 使 用 方法 三 实现 输入 重 定向 的 代码 。 


[示例 程序 5.5 exp redirect3.c] 
main() 
( 
int fd,newfd; 
char bu£[80]; 
fd-gpen("./text.txt ",O RDONLY); 
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fd:0 “上 一 :一 一 stdin fd:0 
fd:l Co stdout fd:l ~ stdout 
进程 进程 
fd:2 [— —— stderr fd:2 - stderr 
fd:3 text.txt fd:3 一 二 | text.txt 
(a) 执行 open 和 close 之 后 (b) 执行 dup 操 作 之 后 


fd:0 | | — ——| text.txt 


进程 fd:1 Fo stdout 


fd:2 


stderr 


(©) 执行 第 二 次 close 之 后 
图 5.5 open close dup close 的 过 程 


newfd- dup? (fd,0); 
if (newfd!= 0) 
i 
perror ("dup?") ; 
exit(EXIT FAILURE); 
i 
close (fd); 
read (0,buf, 80) ; 
write (1,buf,80) ; 
} 
以 上 三 种 方法 均 可 以 实现 重 定向 操作 ,具体 使 用 哪 种 方法 可 以 根据 实际 情况 来 决定 。 
如 果 已 知 重 定向 文件 的 文件 名 ,那么 三 种 方法 都 可 以 实现 ;但 如 果 在 程序 运行 过 程 中 只 能 
获取 重 定向 文件 的 文件 描述 符 ,那么 就 要 考虑 使 用 后 面 两 种 方法 。 


525 ls-l> listtt 


为 了 使 读者 能 够 更 好 地 掌握 如 何在 简单 Shell 中 实现 重 定 向 功能 ,我 们 先 来 学 习 一 
个 具体 的 重 定向 命令 如 何 实现 : 


ls -1»list.txt 


首先 , 先 来 分 析 一 下 Shell 在 实现 ls -1 命令 时 的 过 程 是 怎样 的 。 从 第 4 章 了 解 到 当 
Shell 执行 一 条 前 台 命令 时 ,将 会 为 命令 创建 一 个 子 进 程 : 随 后 在 进程 中 使 用 eXec 函数 来 
执行 命令 程序 ,此 时 Shell 进程 处 于 阻塞 状态 等 待命 令 进程 结束 ; 当 命令 进程 结束 后 ， 
Shell 将 会 显示 命令 进程 运行 的 结果 。 从 这 个 过 程 中 可 以 发 现 : 

CD 命令 进程 需要 进行 重 定向 ,但 是 Shell 进程 并 不 需要 重 定向 。 

(2) 为 了 执行 命令 ,Shell 需要 调用 fork 函数 创建 子 进程 , 子 进程 需要 调用 eXec 函数 
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来 执行 ls -1 命令 。 这 就 要 求 必 须 在 创建 了 子 进程 之 后 ,调用 eXec 函数 之 前 将 子 进程 的 
输出 重 定向 到 文件 list. txt。 这 样 一 来 , 重 定向 仅仅 是 针对 子 进程 的 ,并 且 子 进程 在 调用 
eXec 函数 时 ,并 不 会 影响 到 在 eXec 函数 执行 前 已 打开 的 文件 描述 符 列表 。 

(3) 由 于 list. txt 有 可 能 是 一 个 不 存在 的 文件 ,还 需要 将 重 定向 的 三 种 方法 中 的 
open 函数 换 成 creat 函数 。 

程序 代码 如 示例 程序 5.6 所 示 。 


[示例 程序 5.6 exp lsre.c] 
main() 
{ 
int pid,fd; 
printf ("This is to show how to redirect! Wn") ; 
if((pid- fork())-- - 1) 
i 
perror ("fork"); 
exit(EXIT FAILURE) ; 
D 
else if(pid-- 0) 
i 
close(1); 
fd- creat ("list.txt", 0644) ; 
if (execlp ("1s", "1s", "- 1",NULL)« 0) 
t 
perror ("exec"); 
exit(EXIT FAIIURE); 
) 
D 
else if (pid! 0) 
t 
wait (NULL) ; 
system("cat list.txt"); 


) 


示例 程序 5.6 使 用 了 close then open 来 实现 重 定向 。 请 读者 思考 一 下 ,命令 ls ->> 
list. txt、ls -1 2>err. txt 应 该 如 何 实现 ? 

从 示例 程序 5. 6 中 ,可 以 分 析出 在 简单 Shell 程序 中 实现 重 定向 的 流程 如 下 : 

CD. 以 字符 串 的 方式 读 入 命令 后 ,将 命令 字符 串 分 解 为 命令 名 称 、 参 数 、 选 项 、 重 定向 
等 各 个 分 项 。 

(2) 如 果 存 在 重 定向 符号 , 则 需要 根据 重 定向 符号 的 类 型 ,分 解 出 重 定向 文件 名 和 需 
要 重 定向 的 标准 I/O 文件 。 

(3) 调用 fork 创建 子 进程 ,在 子 进程 中 按照 重 定向 的 要 求 , 重 定向 标准 L/O 文件 , 父 
进程 调用 wait 等 待 子 进 程 结束 。 
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OD 子 进程 重 定向 完成 后 ,调用 eXec 函数 执行 命令 程序 , 父 进程 等 待 子 进程 结束 后 
显示 相应 的 结果 。 
具有 重 定向 功能 的 Shell 程序 代码 实现 作为 本 章 的 习题 请 读者 来 完成 。 


5.3 管道 编程 


Shell 命令 中 有 时 会 出 现 “|" 符 号 ,这 是 管道 符号 ,包含 有 管道 符号 的 命令 是 一 条 管道 
命令 。 管 道 符号 会 改变 前 后 两 条 命令 的 输出 ,命令 执行 过 程 中 , 它 将 前 一 条 命令 的 输出 作 
为 后 一 条 命令 的 输入 ,使 两 条 命令 以 流水 线 的 方式 来 执行 。 

管道 分 为 匿名 管道 和 命名 管道 两 种 ,两 种 管道 都 可 以 编程 实现 管道 命令 ,匿名 管道 多 
用 于 具有 亲缘 关系 的 进程 间 通 信 。 
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当 用 户 在 Shell 环境 中 键入 命令 cat /etc/passwdlgrep root 时 ,Shell 会 为 这 条 管道 
命令 创建 两 个 进程 ,一 个 进程 用 来 运行 cat 命令 , 另 一 个 运行 grep 命令 。grep 将 在 cat 输 
出 的 结果 中 查找 含有 root 字符 串 的 行 显示 在 输出 设备 上 ,如 图 5.6 所 示 。 为 了 将 cat 的 
输出 连接 到 grep 的 输入 上 ,还 需要 创建 一 条 管道 连接 cat 进程 的 stdout 和 grep 进程 的 
stdin。 这 种 管道 通常 是 临时 的 ,因此 可 以 选用 匿名 管道 来 实现 ,在 命令 结束 后 ,匿名 管道 
将 会 自动 消失 。 

管道 连接 


stdin =| cat -- | stdout stdin 上 - -一 一 grep =| stdout 


stderr stderr 


图 5.6 管道 命令 的 原理 示意 


匿名 管道 的 内 部 实现 隐藏 在 内 核 中 ,实质 是 一 个 以 队列 方式 读 写 的 内 核 缓冲 区 ,这 块 
空间 以 队列 的 方式 来 存放 或 发 送 进程 间 需 要 传递 的 消息 ,进程 可 以 以 使 用 文件 的 方式 来 
使 用 匿名 管道 。 匿 名 管道 完全 由 内 核 来 管理 和 维护 ,编写 程序 时 可 以 使 用 pipe 函数 来 创 
建 匿名 管道 ,其 函数 接口 规范 说 明 如 表 5. 3 所 示 。 

表 5.3 pipe 函数 的 接口 规范 说 明 


函数 名 称 pipe 

函数 功能 创建 一 个 匿名 管道 

头 文件 * include-unistd. h> 
函数 原型 int pipe(int pipefd[2]) ; 
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续 表 
参数 pipefd: 存储 匿名 管道 读 端 和 写 端的 整 型 数组 
0: 创建 成 功 
iain —1 出 错 


使 用 pipe 创建 匿名 管道 后 ,将 会 在 参数 pipefd 中 存储 两 个 文件 描述 符 ,其 中 pipefd[0] 
对 应 匿名 管道 的 读 端 ,pipefd[1] 对 应 匿名 管道 的 写 端 。 进 程 使 用 管道 传递 信息 时 ,发 送 
信息 的 进程 连接 在 管道 的 写 端 ,接收 信息 的 进程 连接 在 管道 的 读 端 ,如 图 5.7 所 示 。 
read 


pipefd[0] [ss 
发 送 进程 write 接收 进程 
E 


pipefd[1] 


图 5.7 进程 间 使 用 匿名 管道 通信 


尽管 pipe 调用 返回 时 ,进程 可 以 同时 获得 匿名 管道 读 端 和 写 端 的 文件 描述 符 ,但 使 
用 匿名 管道 实现 进程 间 通 信 时 ,通信 方式 只 能 是 半 双 工 的 。 因 此 根据 通信 双方 进程 的 角 
色 , 发 送 方 需要 关闭 管道 的 读 端 文件 描述 符 ,接收 方 需要 关闭 管道 的 写 端 描述 符 。 如 果 需 
要 在 进程 间 实 现 双向 通信 ,可 以 建立 两 个 匿名 管道 ,每 个 管道 各 负责 一 个 方向 的 通信 。 

使 用 匿名 管道 时 ,pipe 调用 直接 打开 管道 ,关闭 操作 可 以 使 用 close 函数 实现 , 读 写 
操作 使 用 read 和 write 来 完成 。 示 例 程序 5.7 就 是 一 个 使 用 匿名 管道 进行 通信 的 程序 。 


[示例 程序 5.7 exp pipe.c] 
# include< stdio.h> 
# include< unistd.h» 
# includec stdlib.h» 
void main() 
( 
int pfd[2]; 
char buf [81]; 
if (pipe (Ẹfd)==- 1) 
{ 
perror ("pipe"); 
exit(EXIT FAILURE); 
) 
printf ("Ihe pipe will read fron $d, write to %d.\n", pfd[0], p£d[1]); 
write (pfd[1],"This is write to pipe! n",23) ; 
read (pfd[0] ,bu£, 23) ; 
printf ("$s",buf) ; 
} 
编译 后 运行 结果 如 下 : 
root@uantu:~ # ./exp pipe 


The pipe will read fram 3, write to 4. 
This is write to pipe! 
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在 以 上 程序 中 ,示范 了 如 何 使 用 pipe 创建 匿名 管道 ,但 自始至终 只 有 一 个 进程 使 用 
了 管道 ,相当 于 同一 进程 自 说 自 话 ,并 未 实现 进程 间 的 通信 。 以 下 示例 示范 了 如 何在 父子 
进程 间 使 用 匿名 管道 实现 通信 。 在 示例 程序 5. 8 中 , 父 进程 向 子 进程 发 送 了 一 段 信息 , 子 
进程 接收 信息 后 输出 显示 。 

[示例 程序 5.8 exp _ pipecam.c] 

# include< stdio.h> 

# include< stdlib.h» 

# include< unistd.h» 


main() 


i 


int pid,pfd[2]; 
char buf [80]; 
if(pipe(pfg)-- - 1) 
t 
perror ("pipe"); 
exit(EXIT FAILURE); 
) 
pid fork(); 
if(pid« 0) 
t 
perror ("fork") ; 
exit(EXIT FAILURE) ; 
} 
else if(pid-- 0) 
t 
close(pfd[1]); 
if (read (pfd[0] ,bu£, 80) » 0) 
printf ("Message fram child:$sWn",buf); 
close(pfd[0]) ; 
exit(EXIT SUCCESS); 


close (p£d[0]) ; 

if(write (pfd[1], "Pipe is a useful tool!",23) !=- 1) 
printf ("Parent is writing the message! Wn") ; 

close(pfd[1]); 

wait (NULL); 

exit(EXIT SUXESS); 
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编译 后 运行 得 到 结果 如 下 : 


root@ubuntu:~ # goc exp pipeom.c -o exp pipeom 

root@ubuntu:~ # ./exp pipecam 

Parent is writing the message! 

Message fram child:Pipe is a useful tool! 

使 用 匿名 管道 编写 程序 实现 进程 间 通 信 时 ,需要 注意 以 下 几 点 : 

CD 尽管 匿名 管道 是 使 用 文件 描述 符 来 操作 的 ,但 匿名 管道 和 普通 文件 有 着 很 大 的 
区 别 。 匿 名 管道 是 在 内 核 空间 中 的 一 段 队 列 式 的 缓冲 区 , 当 使 用 匿名 管道 进行 通信 的 进 
程 都 退出 后 ,匿名 管道 将 会 自动 释放 ,因此 无 法 保存 信息 。 尽 管 匿名 管道 可 以 使 用 read, 
write,close 函数 来 读 取 、 关 闭 , 但 是 不 能 使 用 lseek 等 函数 来 修改 当前 的 读 写 位 置 ,因为 
匿名 管道 遵守 队列 的 FIFO 原则 。 

(2) 对 匿名 管道 进行 读 / 写 操作 时 ,管道 的 另 一 端 必须 有 相应 的 写 / 读 进程 存在 ,默认 
情况 下 ,管道 两 端 均 以 阻塞 的 方式 对 匿名 管道 进行 操作 。 

(3) 对 管道 执行 读 操作 时 ,如 果 是 以 阻塞 的 方式 读 匿名 管道 的 话 , 有 可 能 会 出 现 以 下 
的 现象 : 

。 如 果 管 道中 无 数据 , 则 读 进程 将 被 挂 起 直到 有 数据 被 写 入 管道 ;如 果 管道 中 的 数 
据 量 少 于 要 求 读 取 的 量 , 则 读 进程 立即 读 出 管道 中 所 有 的 数据 ;如 果 管 道中 的 数 
据 量 大 于 等 于 要 求 读 取 的 量 , 则 读 进程 立即 读 出 期 望 大 小 的 数据 。 

如 果 所 有 写 进 程 都 关闭 了 与 管道 写 端的 联系 时 , 读 端 进程 调用 read 函数 将 会 返 
回 0, 这 意味 着 读 文件 结束 。 

当 有 多 个 进程 对 管道 进行 读 操作 ,由 于 无 法 确定 多 个 读 进程 的 执行 顺序 ,需要 有 
某 种 方法 来 协调 这 些 读 进程 对 管道 的 访问 。 

OD 对 管道 执行 写 操作 时 ,如 果 是 以 阻塞 的 方式 写 匿名 管道 的 话 , 有 可 能 会 出 现 以 下 
的 现象 : 

。 当 管 道 已 满 时 , 写 进程 再 对 管道 做 写 操作 时 , 写 进 程 会 被 阻塞 ;POSIX 规定 内 核 不 
会 拆 分 小 于 512 字 节 的 块 ,因此 如 果 有 两 个 进程 向 管道 写 数 据 ,只 要 每 一 个 进程 
都 限制 消息 不 大 于 512 字 节 , 写 入 的 消息 就 不 会 被 内 核 拆 分 。 

如 果 所 有 读 进 程 关 闭 了 与 管道 读 端的 联系 ,再 执行 写 操作 时 , 写 进程 将 会 收 到 
SIGPIPE 信号 , 若 该 信号 不 能 终止 进程 , 则 write 调用 返回 一 1, 并 将 errno 置 为 
EPIPE, 

当 有 多 个 写 进程 连接 在 管道 写 端 时 ,由 于 无 法 确定 多 个 写 进程 的 执行 顺序 ,需要 
有 某 种 方法 来 协调 这 些 写 进程 对 管道 的 访问 。 

(5) 管道 的 两 端 还 可 以 通过 调用 fcntl 函数 来 改变 读 、 写 方式 。 如 果 以 O_NDELAY 
或 O_ NONBLOCK 方式 设置 了 读 端 , 当 管道 中 有 数据 时 , 读 进程 会 读 取 数据 ;如 果 没 有 数 
据 ,read 函数 将 立即 返回 一 1, 并 且 将 errno 29g EAGAIN。 如 果 以 O_NDELAY 或 O_ 
NONBLOCK 方式 设置 了 管道 的 写 端 , 当 管道 中 有 足够 空间 时 , 写 进程 会 写 和 数据 ;如 果 
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没有 足够 的 空间 ,write 函数 将 立即 返回 一 1, 并 且 将 errno 置 为 EAGAIN。 

(6) 匿名 管道 同样 可 以 实现 无 亲缘 关系 的 进程 间 通 信 , 但 需要 辅助 以 文件 描述 符 传 
递 机 制 ,例如 ,可 以 借助 于 本 地 的 套 接 字 。 因 此 通常 使 用 匿名 管道 来 实现 有 亲缘 关系 的 进 
程 间 通信 ,这 也 是 在 Linux 系统 中 最 常用 的 一 种 IPC 机 制 。 


532 命名 管道 
匿名 管道 由 于 其 特殊 性 ,通常 用 于 实现 有 亲缘 关系 的 进程 间 的 通信 。 如 果 要 在 无 亲 
缘 关系 的 进程 间 进 行 通信 ,可 以 使 用 命名 管道 文件 。 命 名 管道 也 称 为 FIFO 文件 , 它 是 存 
在 于 文件 系统 中 的 一 类 特殊 文件 ,使 用 FIFO 可 以 很 方便 地 实现 在 同一 主机 上 不 同 进程 
之 间 的 通信 。 命 名 管道 文件 可 以 在 Shell 中 使 用 命令 mknod 来 创建 ,也 可 在 编写 程序 时 ， 
使 用 函数 mkfifo 来 创建 ,该 函数 接口 规范 说 明 如 表 5.4 所 示 。 
表 5.4 mkfifo 函数 的 接口 规范 说 明 


函数 名 称 mkfifo 

函数 功能 创建 一 个 命名 管道 文件 

头 文件 # include sys/stat, h> 

函数 原型 int mkfifo(char * filename, mode t mode); 


filename: 命名 管道 文件 的 名 称 


参数 mode: 命名 管道 的 使 用 方式 
0. 创建 成 功 
minia! 一 1; 出 错 


说 明 : 在 使 用 mkfifo 创建 命名 管道 文件 时 ,filename 指定 的 文件 必须 是 不 存在 的 ， 
mode 与 函数 open 中 使 用 的 mode 方式 相 类 似 。 

命名 管道 在 创建 以 后 ,其 使 用 方式 与 普通 文件 非常 相似 ,仍然 使 用 open, read, write 
和 close 函数 来 进行 操作 ,但 其 本 质 还 是 在 内 核 空间 的 队列 式 内 存 , 因 此 在 命名 管道 文件 
中 ,不 能 使 用 lseek 等 定位 函数 或 移动 文件 的 读 写 指针 。 另 外 ,命名 管道 文件 关闭 时 , 尽 
管 文 件 的 各 种 属性 依然 存在 于 文件 系统 中 ,但 内 核 释 放 了 命名 管道 所 占用 的 空间 ,所 以 文 
件 中 并 没有 任何 数据 保存 下 来 。 以 下 是 一 个 使 用 命名 管道 文件 实现 父子 进程 通信 的 示例 
程序 。 需 要 指出 的 是 ,尽管 示例 程序 5.9 中 使 用 的 进程 存在 亲缘 关系 ,但 在 实际 使 用 时 ， 
由 于 命名 管道 文件 的 名 称 是 独立 于 进程 存在 的 ,因此 没有 亲缘 关系 的 进程 之 间 也 可 以 使 
用 命名 管道 文件 来 实现 通信 。 

[示例 程序 5.9 ep fifo.c] 

# include< fcntl.b» 

# include< stdlib.h> 

# includec stdio.h» 

# includec unistd.h> 

# includec sys/stat .h> 
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main() 
{ 
int pid, fd; 
Char buf [80]; 
mfifo("fifotest", 0644); 
if((pid- fork())> 0) 
t 
fd- open ("fifotest",O WRONLY); 
write (fd, "message to test FIFO!",22); 
close(fd); 
exit(EXIT SUCCESS); 
) 
else if(pid-- 0) 
t 
fd open("fifotest",O RDONLY); 
read(fd,buf, 80) ; 
printf ("$3 Nn", buf) ; 
close (fd); 
exit(EXIT SUCCESS); 


) 
上 面 的 程序 中 ,父子 进程 分 别 以 只 读 和 只 写 的 方式 打开 命名 管道 文件 , 父 进程 写 人 信 
息 , 子 进程 接收 之 后 ,将 信息 显示 在 标准 输出 设备 上 。 示 例 程序 5. 9 运行 结果 如 下 所 示 : 


root@ubuntu:~ # ./exp fifo 
root@ubuntu:~ # message to test FIFO! 


以 下 是 两 个 无 亲缘 关系 的 进程 使 用 命名 管道 通信 的 例子 。 命 名 管道 文件 由 写 端 程序 
负责 创建 , 写 端 以 只 写 方式 打开 命名 管道 , 写 和 人 buf 中 存储 的 信息 后 ,关闭 与 管道 文件 的 
联系 。 写 端 程序 代码 如 示例 程序 5. 10-1 所 示 。 


[示例 程序 5.10- 1 fifo sender.c] 
# include< stdio.h> 
# include< stdlib.h> 
# includec unistd.h> 
# include sys/stat.h> 
# includec fcntl.h> 
# define FIFOETIE ". /tmpfifo" 
void main() 
t 
int fifofd; 
char buf [80]- "This message will send to the receiver!"; 
if(nkfifo(FIFOFILE, 0666)« 0) 
i 
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perror ("nkfifo") ; 
exit(EXIT FAIIFE); 
) 
fifofd-cpen(FIFOFIIE,O WECNLY); 
if(fifofd« 0) 
{ 
Perror ("open") ; 
exit(EXIT FAILURE); 
) 
printf ("now process $d is writing data to the FIFO..An",getpid()); 
if (write (fifofd,buf, 40)» 0) 
t 
printf ("write success!NAn") ; 
) 
close (fifofd); 
} 


读 端 程序 按照 约定 的 文件 名 以 只 读 的 方式 打开 管道 ,从 中 读 取信 息 并 将 信息 输出 显 
示 。 读 端 程序 代码 如 示例 程序 5. 10-2 所 示 。 


[示例 程序 5.10- 2 fifo receiver.c] 
# includec stdio.h> 
# includec stdlib.h> 
# includec unistd.h» 
# includec sys/stat..h» 
# includec fontl.h> 
# define FIFOFIIE "./trpfifo" 
void min () 
t 
int fifofd; 
char buf [80]; 
fifofd-cpen(FIFOFIIE,O RDONLY) ; 
if(fifofd« 0) 
t 
perror ("open"); 
exit(EXIT FRIIURE) ; 
} 
printf ("now process $d will receive data to the FIFO..\n",getpid()); 
if (read(fifofd,buf, 40)» 0) 
{ 
printf ("The message is :%s\n",buf); 
} 
close (fifofd); 
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分 别 将 以 上 两 个 程序 编译 后 运行 得 到 结果 如 下 : 
root@ubuntu:~ # goc exp writetofifo.c -o fifosender 
root@ubuntu:~ # goc exp readframfifo.c -o fiforeceiver 
root@ubuntu:~ f ./fifosender & // 以 后 台 方 式 运行 写 端 程序 
[1] 6154 

rootG$ubuntu:^ # ./fiforeceiver 

now process 6154 is writing data to the FIFO... 

write success! 

now process 6155 will receive data to the FIFO... 

The message is :This message will send to the receiver! 
[+ Doe -/fifosender 


命名 管道 是 一 种 特殊 类 型 的 文件 ,尽管 在 文件 系统 中 有 与 之 对 应 的 文件 i 节点 信息 ， 
但 其 实质 和 匿名 管道 一 样 ,都 是 由 内 核 空间 管理 的 一 段 内 存 空间 , 它 存储 的 通信 信息 实际 
是 存放 在 内 存 之 中 的 ,因此 当 通 信 进 程 都 退出 以 后 ,这 些 没 读 出 的 信息 也 就 丢失 了 。 在 操 
作 命 名 管道 时 ,要 注意 以 下 一 些 事项 : 
(1) 当 一 个 进程 以 读 或 写 的 方式 打开 了 命名 管道 的 一 端 时 ,除非 管道 的 另 一 端 已 被 
其 他 进程 以 写 或 读 的 方式 打开 了 ,否则 这 个 进程 将 一 直 被 阻塞 ,直到 管道 另 一 端 被 打开 。 
(2) 一 个 进程 可 以 以 可 读 可 写 方式 打开 命名 管道 ,此 时 这 个 进程 不 会 被 阻塞 ,该 进程 
既是 读 进程 ,也 是 写 进程 。 
(D. 如 果 命 名 管道 两 端 都 已 被 打开 , 读 、 写 操作 以 阻塞 方式 进行 的 话 : 
。 对 于 读 操作 来 说 : 如 果 管 道中 没有 数据 , 读 操 作 将 被 阻塞 ;如 果 管 道中 的 数据 量 
小 于 读 进 程 需要 的 数据 量 , 则 读 操作 读 出 所 有 数据 ;如 果 管 道中 的 数据 量 大 于 等 
于 读 进 程 需要 的 数据 量 , 则 读 操作 读 出 指定 大 小 的 数据 。 
。 对 于 写 操作 来 说 : 如 果 管 道 已 满 , 写 操作 将 被 阻塞 ;如 果 管 道中 的 空间 小 于 写 进 
程 需要 的 空间 , 则 写 操作 将 管道 写 满 后 写 进程 阻塞 ;如 果 管 道中 的 空间 大 于 等 于 
写 进程 需要 的 空间 , 则 写 操作 写 入 指定 大 小 的 数据 。 
(4) 如 果 打 开 管道 的 读 、 写 进程 其 中 一 个 退出 了 ,车 退 出 的 是 读 进程 , 则 写 进程 执行 
写 操作 时 ,将 返回 SIGPIPE 信和 号 ;车 退出 的 是 写 进 程 , 则 读 操作 取 完 管道 中 的 数据 后 ,将 
不 再 被 阻塞 ,直接 返回 0。 
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在 这 一 节 中 ,来 分 析 一 条 有 具体 的 管道 命令 如 何 实现 ,希望 从 中 能 够 给 读者 启发 ,用 以 
实现 简单 Shell 中 的 管道 命令 。 这 里 使 用 匿名 管道 来 实现 ls -1| grep root 命令 ,该 命令 从 
ls -1 的 结果 中 查找 出 与 root 相关 的 信息 显示 。 

根据 在 匿名 管道 一 节 所 学 的 内 容 , 可 以 分 析 得 出 以 下 结论 : 

(1) 实现 ls -l| grep root 命令 时 ,首先 Shell 需要 创建 一 条 匿名 管道 。 

(2) 为 每 一 条 命令 创建 一 个 进程 ,这 样 一 来 ,两 个 命令 所 在 的 进程 可 继承 得 到 匿名 管 
道 读 端 和 写 端的 文件 描述 符 。 
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(3) ls 进程 关闭 管道 读 端 ,并 将 文件 描述 符 1 关联 到 管道 的 写 端 ;grep 进程 关闭 管道 
写 端 ,并 将 文件 描述 符 0 关联 到 管道 的 读 端 。 
(4) 两 个 子 进程 分 别 用 eXec 函数 执行 ls -1 和 grep 命令 ,Shell 进程 等 待 两 个 子 进程 


结束 。 


Is -l| grep root 命令 的 管道 连接 情况 示意 图 如 图 5. 8 所 示 。 


grep 子 进程 父 进程 ls 子 进程 
fd0 | fdl | fd2 fd0 | fdl | fd2 | fd3 |fd4 fd0 | fdl | fd2 
-| 管道 II 


图 5.8 ls -1| grep root 的 管道 示意 图 


读 端 


写 端 


实现 ls -l| grep root 命令 的 程序 代码 如 示例 程序 5. 11 所 示 。 


[示例 程序 5.11 1s_grep.c] 
# include< stdio.h> 

# include< stdlib.h> 

# include< unistd.h> 

# include fentl.h» 

# includec sys/wait.h» 


int main() 


{ 


int fæs[2],pid; 

if (pipe (fdes)< 0) 

t 
perror ("pipe") ; 
exit(EXIT FAILURE); 

$ 

pid fork(); 

if(pid« 0) 

f 
perror ("fork"); 
exit(EXIT FAIIUFE) ; 

) 

else if(pid-- 0) 

t 
close (fdes[0]) ; 
dug? (£des[1],1) ; 
close(fdes[1]); 


execlp ("ls", "15", "- 1",NULZ) ; 
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} 


pid fork(); 

if(pid« 0) 

1 
perror ("fork") ; 
exit(EXIT FAIIDFE); 

} 

else if (pid-- 0) 

t 
close(fdes[1]); 
dup? (fdes [0],0) ; 
close (fdes[0]) ; 
execlp ("grep", "grep", "root", NULL) ; 


close (fdes[0]) ; 
close (fdes[1]); 
wait (NULL) ; 
wait (NULL); 


编译 后 运行 得 到 如 下 结果 : 


root(ubuntu:» # gcc ls grep.c -o ls grep 
root@ubuntu:~ # ./ls grep 
drwxrwxrwx 1 root root 4096 10 月 — 9 16:08 mymount 
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使 用 管道 编程 时 ,需要 创建 一 条 管道 连接 到 执行 命令 的 进程 上 ,随后 进程 读 管道 的 输 
出 端 或 写 管道 的 输入 端 。 在 这 一 过 程 中 ,需要 使 用 到 fork, pipe, eXec 族 函 数 , 使 用 完毕 
以 后 需要 调用 close 来 关闭 管道 。 而 标准 L/O 库 提供 了 一 对 函数 一 一 popen 和 pclose, 这 


对 函数 可 以 将 这 一 系列 操作 整合 为 一 个 操作 。 


popen 函数 先 执行 fork 创建 一 个 子 进程 , 紧 接 着 在 子 进程 中 调用 eXec 函数 执行 cmd 
命令 或 程序 ,并 且 返 回 一 个 标准 L/O 文件 流 指针 ,随后 将 文件 指针 连接 到 子 进程 的 标准 
输入 或 标准 输出 。popen 函数 的 接口 规范 说 明 如 表 5.5 所 示 。 


35.5 popen 函数 的 接口 规范 说 明 


函数 名 称 


popen 


函数 功能 


建立 一 个 指向 进程 的 流 


第 5 章 ， 重 定向 与 管道 e^. 


续 表 
头 文件 * include stdio. h> 
函数 原型 FILE * popen(char * cmd, char * type); 
cmd: 要 执行 的 命令 
Si types 连接 方式 
非 NULL. 创建 成 功 (创建 的 流 文件 指针 ) 
EHE NULL: 出 错 


说 明 : type 可 以 选择 “r" 或 “w”, 当 type 为 “r" 时 ,表示 将 子 进 程 看 作 读 的 对 象 , 父 进 
程 接收 到 的 流 指针 连接 在 子 进程 的 标准 输出 上 。 代 码 “fp 二 popen(cmd,"r");” 的 结果 如 
图 5.9 所 示 。 

当 type 为 “w” 时 ,表示 将 子 进程 看 作 写 的 对 象 , 父 进程 接收 到 的 流 指针 连接 在 子 进 
程 的 标准 输入 上 。 代 码 “fp 二 popen(cmd,"w");” 的 结果 如 图 5. 10 所 示 。 


父 进程 子 进程 ”cmd 父 进程 FHF cmd 
fp stdout fp e stdin 
图 5.9 fp 二 popen(cmd,"r") 的 示意 图 图 5.10 fp 二 popen(cmd,"w") 的 示意 图 


在 编写 代码 时 ,popen 与 fopen 非常 类 似 ,只 不 过 fopen 操作 的 对 象 是 文件 ,popen 操 
作 的 对 象 是 进程 。 例 如 ,代码 “fopen("filel","w");” 表 示 以 写 的 方式 打开 文件 filel ,而 代 
码 “popen("ls","r");” 表 示 以 读 的 方式 打开 进程 Is。 从 对 比 中 可 以 看 出 ,popen 可 以 将 进 
程 像 文 件 一 样 操作 。 

使 用 popen 打开 的 标准 I/O 文件 流 指针 ,需要 使 用 pelose 函数 来 关闭 。pclose 函数 
的 接口 规范 说 明 如 表 5.6 所 示 。 


35.6 pelose 函数 的 接口 规范 说 明 


函数 名 称 pclose 

函数 功能 关闭 popen 打开 的 流 文件 

头 文件 # include<stdio. h> 

函数 原型 int pclose(FILE * fp); 

参数 fp: 要 关闭 的 流 文件 指针 

返回 什 Pu Ne 的 终止 状态 ) 


pclose 关闭 标准 I/O 文件 流 后 ,等 待 在 popen 中 指定 的 cmd 执行 结束 ,返回 其 终止 
示例 程序 5. 12 是 一 个 使 用 流 重 定向 实现 管道 编程 的 例子 。 


[示例 程序 5.12 exp. popen.c] 
# include< stdio.h» 


FOE * fp; 
char buf [80]; 
int i-0; 


fp- popen ("ls - 1","r"); 
while (fgets (buf, 80, fp) != NULL) 
printf ("zs\n",buf); 


pelose (fp); 
retum 0; 
} 


在 这 个 示例 程序 中 , 父 进 程 创建 的 子 进程 执行 ls -1 命令 , 父 进程 将 标准 输入 连接 到 
子 进程 的 输出 , 读 出 1s -1 命令 的 结果 ,然后 显示 在 标准 输出 设备 上 。 编 译 后 运行 得 到 如 


下 结果 : 


root@ubuntu:~ # ./exp popen 


total 44 

-rwxrwxrwx lhr 
-rw-r--r--lhr 
-rw-r--r--lhr 
-rw-r--r--lhr 
-rw-r--r--lhr 


-rwxr-xr-x lhr 


HHRHHHRHHRHRH 


-rw-r--r--lhr 


7384 
24 


drwxrwxrwx 1 root root 4096 


-rw-r--r--lhr hr 
-rw-r--r--lhr hr 


88 
44 


10H 
10H 
10H 
10H 
10H 
10H 
10H 
10H 
10H 
10H 


17 09:16 a.out 
6 17:49 err.txt. 
6 20:59 exp dup.c 
9 16:06 exp readframfifo.c 
9 16:02 exp writetofifo.c 
6 17:39 for redirect.c 
9 16:48 1s grep.c 
17 09:17 mymount 
6 17:49 result. 
6 19:35 text.txt. 


还 可 以 用 popen 和 pclose KCK 5. 3. 3 节 中 实现 的 1s -1| grep root 命令 重新 改写 。 
示例 程序 5. 13 就 是 改写 后 的 程序 代码 。 


[示例 程序 5.13 1s_grep2.c] 


# include< stdlib.h» 
# include< stdio.h> 
# include< unistd.h> 


void main() 

t 
FIE * fp; 
int fd; 


fp-popen ("15 -1","r"); 


if(fpl- NULL) 
t 
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perror ("fileno") ; 
exit(EXIT FAIIDFE); 
} 
if (duc? (fd,0)« 0) 
t 
perror ("dup") ; 
exit(EXIT FAILUFE); 
) 
if (execlp ("grep", "grep", "root", NULL) « 0) 
t 
perror ("exec"); 
pelose(fp); 
exit(EXIT FAIRE); 


在 这 个 版 本 的 程序 中 ,使 用 popen 建立 了 子 进程 来 执行 ls -1 命令 , 父 进 程 读 子 进程 
的 输出 ,并 执行 grep 操作 。 父 进程 中 使 用 fileno 函数 从 fp 中 提取 出 对 应 的 文件 描述 符 ， 
使 用 dup2 将 标准 输入 文件 重 定 向 到 fp 所 指 的 流 文件 ,从 而 建立 了 父 进程 和 子 进程 间 的 
管道 。 由 于 调用 了 execlp 函数 ,因此 , 父 进程 调用 成 功 时 ,无 法 关闭 fp, 只 能 依靠 进程 结 
东 时 内 核 来 关闭 fp, 但 如 果 调 用 execlp 不 成 功 , 父 进 程 需要 使 用 pclose 函数 来 关闭 连接 
到 子 进程 上 的 fp。 该 程序 运行 结果 与 示例 程序 5. 11 的 结果 相同 。 


5.4 小 结 


重 定向 和 管道 是 Linux 环境 下 经 常会 使 用 到 的 命令 ,它们 是 进程 间 通 信和 常用 的 两 种 
方式 ,理解 和 掌握 这 两 种 命令 的 执行 原理 对 理解 进程 间 通信 有 重要 的 意义 。 

本 章 首先 介绍 了 Shell 环境 中 重 定向 命令 和 管道 命令 如 何 使 用 ,以 及 重 定向 命令 和 
管道 命令 实现 的 原理 ;随后 详细 介绍 了 编写 程序 时 实现 重 定向 的 三 种 方式 ,并 以 ls -1 命 
令 为 例 验 证 了 方法 的 可 行 性 。 

本 章 还 分 析 了 管道 命令 工作 的 原理 ,介绍 了 在 编写 程序 时 实现 管道 通信 的 方法 ,还 分 
析 了 匿名 管道 与 命名 管道 的 异同 点 。 

本 章 最 后 介绍 了 popen 和 pelose 函数 ,这 一 对 函数 可 以 将 创建 管道 和 重 定向 结合 起 
来 ,快速 搭建 起 进程 间 通 信 的 桥梁 ,实现 进程 间 通 信 。 
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习 题 


一 、 填空 题 

1. 命令 who 1 二 usrlist 表示 重 定向 。 

2. 和 函数 可 以 用 来 复制 文件 描述 符 。 
3. 二 二 符号 表示 重 定向 。 
4 
5 


. 编程 将 标准 输出 重 定向 到 文件 描述 符 6 对 应 的 文件 上 , 则 应 使 用 语句 
. 管道 就 是 将 前 一 个 命令 的 作为 后 一 个 命令 的 ,分 为 和 
两 种 ,其 中 只 能 在 有 亲缘 关系 的 进程 间 使 用 。 

6. 也 称 为 FIFO 文件 。 

7. 使 用 pipe 函数 创建 了 匿名 管道 pfd, 其 中 pfd[ ] 为 管道 的 读 端 ， 
pfd[ ] 为 管道 的 写 端 。 

二 、 简 答题 

1. 请 说 明 匿 名 管道 和 命名 管道 的 异同 点 。 

2. 重 定向 得 以 实现 的 前 提 条 件 是 什么 ? 

三 、 编 程 题 

l. 编写 程序 实现 ls -177—7 list. txt。 

2. 通过 管道 模拟 实现 Shell 命令 : cat file | sort。 

3. 请 使 用 popen 和 pclose 函数 实现 Shell 命令 : cat file | sort. 

A. 请 使 用 管道 编写 程序 ,实现 同一 父 进程 创建 的 两 个 子 进 程 之 间 的 通信 。 
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当 运行 了 一 个 导致 死 循 环 的 程序 时 ,只 要 在 键盘 上 键入 Ctrl 十 c, 程 序 就 可 以 顺利 被 
终止 。 当 Ctrl 十 c 被 按 下 的 时 候 发 生 了 什么 事情 呢 ? 实际 上 当 按 下 Ctrl 十 c 时 ,内 核 接收 
到 输入 设备 发 来 的 数据 ,产生 了 一 个 名 为 SIGINT 的 信号 ,这 个 信号 发 送 给 了 前 台 进 程 ， 
其 作用 就 是 终止 正在 运行 的 前 台 进 程 。 


6.1 信号 概述 
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信号 是 一 种 软件 中 断 , 它 是 Linux 环境 中 所 使 用 的 一 种 进程 间 通 信 机 制 ,并 且 是 一 种 
异步 通信 机 制 , 即 信号 可 以 在 任何 时 刻 产 生 并 发 送 给 进程 ,而 进程 对 于 接收 到 信号 这 一 事 
件 是 不 可 预知 的 。 进 程 可 以 提前 约定 好 当 接 收 到 信号 时 要 执行 哪些 操作 , 即 约定 信号 处 
理 方 式 和 安装 信号 处 理 函 数 。 当 收 到 信号 时 ,进程 挂 起 自身 的 执行 , 转 去 执行 信号 处 理 函 
数 , 当 信号 处 理 完毕 后 ,进程 继续 执行 。 

想象 现实 世界 中 , 当 你 驾驶 汽车 行驶 在 公路 上 ,忽然 遇 到 了 一 位 交警 ,向 你 做 出 停车 
的 手势 ,你 按照 要 求 停 下 了 车 。 在 这 个 过 程 中 ,在 公路 上 驾驶 汽车 就 类 似 于 Linux 系统 中 
运行 的 进程 ,交警 做 出 的 停车 手势 就 是 系统 向 进程 发 出 的 一 个 信号 ,你 看 到 手势 停 下 了 车 
就 是 进程 暂停 自身 的 运行 ,对 信号 做 出 了 响应 。 交 警 做 出 停车 的 手势 并 不 是 由 于 你 开车 
所 导致 的 ,因此 这 个 信号 是 异步 于 开车 这 个 进程 的 。 

Linux 系统 在 /usr/include/signal.h 文件 中 定义 了 每 个 信和 号 的 宏 ,注释 解释 了 信和 号 的 
含义 (实际 使 用 的 操作 系统 不 同 ,会 导致 信号 定义 在 不 同 的 文件 中 ,例如 某 些 版 本 的 
Ubuntu 中 信号 定义 在 bits/signum. h 中 )。 

/*Sigals */ 

# define SIGHUP 

# define SIGINT 

# define SIGQUIT 

# define SICIL 

# define SIGIRAP 

d define SIGAERT 

# define SIGIOT 

# define SIGEUS 


/*Hangp (POSIX) */ 

/* Interrupt (ANSI) */ 

/* Quit (PSIK) */ 

/* Illegal instruction (ANSI) */ 
/* Trace trap (POSIX) */ 

/* Boort (NSI) */ 

/* IOT trap (4.2 BSD) */ 
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/* BUS error (4.2 BSD) */ 


# define SIGFPE 8 
# define SIGKIIL 9 
# define SIGUSR] 10 
# define SIGSEGV n 
# define SIGUSR2 12 
# define SIGPIPE 13 
# define SIGALFM 14 
# define SIGIEFM 15 
# define SIGSTKELT 16 
# define SIGCID SIGCHID 
# define SIGCHID 17 
# define SIGOONT 18 
# define SIGSTOP 19 
# define SIGTSTP 20 
# define SIGITIN 21 
# define SIGTTOU 22 
# define SIGURG 23 
# define SIGXCFU 24 
# define SIGXFSZ 25 
# define SIGUTAIFM 26 
# define SIGPROF 27 
# define SIGWINCH 28 
# define SIGEOLL. SIGIO 
# define SIGIO 29 
# define SIGFWR 30 
# define SIGSYS 31 


# define SIGUNUSED 31 


# define NSIG 65 


在 Linux 系统 中 可 以 使 用 kill -1 命令 查看 这 些 信 号 的 名 字 。 每 个 信号 的 名 字 都 以 
SIG 开头 ,每 个 名 字 所 对 应 的 整 型 值 即 名 字 前 面 括号 内 的 值 ,每 一 个 信号 表示 一 种 需要 中 
断 的 情况 。 例 如 : 2 号 信号 SIGINT 表示 中 断 当 前 的 前 台 进程 ,13 号 信号 SIGPIPE 表示 


使 用 管道 操作 时 产生 的 中 断 。 


信和 号 可 以 分 为 可 靠 信号 和 不 可 靠 信号 。Linux 系统 中 总 共 定义 了 62 个 信号 ,其 中 信 
号 值 小 于 32 的 继承 自 UNIX 系统 ,早期 的 UNIX 信号 是 不 可 靠 信 号 。 这 里 的 不 可 靠 是 
指 不 支持 信号 队列 或 不 支持 排队 。 在 进程 执行 过 程 中 产生 了 多 个 相同 的 信号 时 ( 收 到 信 
号 的 速度 超过 进程 处 理 的 速度 时 ,就 会 产生 这 种 情况 ) ,这 些 没 来 得 及 处 理 的 相同 信号 就 
会 被 丢掉 ,仅仅 留 下 一 个 信号 。SIGRTMIN 之 后 的 信号 为 可 靠 信号 , 即 如 果 有 多 个 相同 
的 信号 发 送 到 进程 的 时 候 , 这 些 没 来 得 及 处 理 的 信号 就 会 排 人 进程 的 信号 队列 。 等 进程 


/* Floating- point exception (ANSI) */ 
/* Kill, unblockable (FOSIX) */ 

/* User-definedsignall (POSIX) */ 
/* Segrentation violation (ANSI) */ 
/* User-definedsignal2 (POSIX) */ 
/* Broken pipe (POSIX) */ 

/* Alam clock (POSIX) */ 

/* Temination (ANSI) */ 

/* Stack fault */ 

/* Same as SIGCHID (System V) */ 

/* Child status has changed (POSIX) */ 
/* Continue (POSIX) */ 

/* Stop, unblockable (POSIX) */ 

/* Keyboard stop (FOSIX) */ 

/* Background read fran tty (POSIX) */ 
/* Background write to tty (POSIX) * / 
/* Urgent condition on socket (4.2 BSD) * / 
/* CEU limit exceeded (4.2 BSD) */ 

/* File size limit exceeded (4.2 BSD) * / 
/* Virtual alam clock (4.2 BSD) */ 
/* Profiling alam clock (4.2 BSD) */ 
/* Window size change (4.3 BSD, Sun) */ 
/* Pollable event occurred (System V) */ 
/* I/O nw possible (4.2 BSD) */ 

/* Power failure restart (System V) * / 
/* Bad system call */ 


/* Biggest signal mmber +1 
(including real- time signals)  * / 


有 机 会 来 处 理 的 时 候 , 依 次 再 处 理 , 信 号 不 会 丢失 。 
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信号 还 可 以 按照 来 源 分 为 同步 信号 和 异步 信号 。 如 果 进 程 收 到 的 信号 是 由 于 进程 的 
某 个 操作 所 产生 的 ,这 种 信号 称 为 同步 信号 ;如 果 进 程 接收 到 的 信号 是 由 进程 之 外 的 事件 
所 引发 的 ,这 种 信号 称 为 异步 信号 。 


612 信号 的 来 源 和 处 理 过 程 


信号 来 源 于 内 核 中 的 信号 机 制 , 系 统 里 的 各 种 事件 促使 内 核 向 进程 发 送信 号 ,产生 的 
原因 有 可 能 是 以 下 的 事件 : 

CD. 用 户 通过 终端 输入 终端 驱动 程序 分 配给 信号 控制 字符 的 按键 ,请 求 内 核 产生 信 
号 。 例 如 : 当 用 户 从 终端 输入 Ctrl 十 c、Ctrl 十 /等 字符 时 ,都 会 产生 相应 的 信号。 

(2) 进程 执行 出 错时 ,内 核发 现 错误 ,发 送 给 进程 一 个 信号 。 当 进程 越界 访问 内 存 、 
算数 表达 式 除数 为 0、 整 型 数 溢出 都 会 产生 相应 的 信和 号。 内核 也 可 以 使 用 信和 号 向 进程 发 
送 特定 事件 的 通知 。 

(3) 一 个 进程 可 以 调用 Kill 向 另 一 个 进程 发 送信 号 。 例 如 在 Shell 中 输入 命令 kill -9 
1234, 即 可 发 送信 号 结束 进程 号 为 1234 的 进程 。kill 命令 或 函数 可 以 实现 进程 间 使 用 信 
号 通信 。 

当 一 个 信号 因为 以 上 某 一 事件 产生 后 ,内核 会 将 其 发 送 给 指定 的 进程 。 信 号 发 送 到 
目标 进程 后 ,将 会 被 注册 , 即 系统 将 信号 添加 到 目标 进程 PCB 块 的 相关 数据 结构 中 。 从 
信号 产生 到 处 理 之 前 这 段 时 间 里 信号 的 状态 称 为 信号 未 决 。 

目标 进程 接收 到 信号 后 ,将 会 根据 相应 的 设置 做 出 处 理 动作 ,这 称 为 信号 的 递送 。 目 
标 进 程 有 可 能 提前 做 了 设置 ,说 明 它 不 接收 哪些 信号 , 即 屏蔽 信号 。 在 屏蔽 信号 期 间 发 送 
给 该 进程 的 被 屏蔽 信号 在 结束 屏蔽 之 前 是 无 法 被 接收 到 的 。 

当 进程 接收 到 的 信号 是 未 屏蔽 的 或 对 未 决 信号 取消 了 屏蔽 ,此 时 进程 将 会 按 提 前 约 
定好 的 方式 处 理 信号 。 在 进程 执行 信号 的 相应 处 理 函 数 之 前 ,系统 将 会 把 信号 从 进程 
PCB 块 中 注销 ,随后 根据 提前 约定 好 的 方式 来 处 理 信号 。 


613 信号 的 处 理 方式 


Linux 系统 提供 三 种 处 理 信号 的 方式 : 按 默认 方式 处 理 、 忽 略 信 号 和 捕捉 信和 号。 

COD. 按 默认 方式 处 理 : 系统 为 每 个 信号 设置 好 了 默认 动作 ,大 多 数 信号 的 默认 动作 
是 终止 进程 。 

(2) 忽略 信号 : 忽略 信号 是 指 将 接收 到 的 信号 直接 丢弃 ,不 做 任何 操作 。 大 多 数 信 
号 可 以 使 用 这 种 方式 进行 处 理 , 但 是 SIGKILL 和 SIGSTOP 这 两 个 信号 是 不 能 被 忽略 或 
阻塞 的 ,也 不 能 够 被 捕捉 。 

(3) 捕捉 信和 号: 进程 提前 告诉 内 核 , 当 信号 到 来 时 应 该 做 出 什么 样 的 反应 ,这 个 动作 
称 为 捕捉 信号 。 为 了 实现 这 一 点 ,进程 需要 提前 通知 内 核 在 指定 信号 发 生 时 调用 一 个 用 
户 函 数 ,可 以 把 对 信和 号 做 出 的 处 理 写 在 这 个 函数 中 。 

在 Shell 环境 中 键入 man 7 signal 命令 ,执行 得 到 表 6. 1 的 内 容 , 从 中 可 以 查看 到 每 
个 信号 的 默认 处 理 方式 。 
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表 6.1 信号 的 默认 处 理 方式 


Signal Value Action Comment 
SIGHUP 1 Term Hangup detected on controlling terminal or death of controlling process 
SIGINT z Term Interrupt from keyboard 
SIGQUIT 3 Core Quit from keyboard 
SIGILL 4 Core Illegal Instruction 
SIGABRT 6 Core Abort signal from abort(3) 

SIGFPE 8 Core Floating point exception 

SIGKILL 9 Term | Kill signal 

SIGSEGV 11 Core Invalid memory reference 

SIGPIPE 13 Term Broken pipe: write to pipe with no readers 
SIGALRM |14 Term | Timer signal from alarm(2) 

SIGTERM |15 Term | Termination signal 

SIGUSR1 30,10,16 | Term User-defined signal 1 

SIGUSR2 31,12,17 | Term | User-defined signal 2 

SIGCHLD | 20,17,18 | Ign Child stopped or terminated 

SIGCONT | 19,18,25 | Cont Continue if stopped 

SIGSTOP 17,19,23 | Stop Stop process 

SIGTSTP 18,20,24 | Stop Stop typed at terminal 

SIGTTIN 21,21,26 | Stop Terminal input for background process 
SIGTTOU | 22,22,27 | Stop Terminal output for background process 


K 6.1 中 ,Term 表示 终止 进程 ;Core 表示 终止 进程 并 在 进程 当前 工作 目录 的 core 
文件 中 复制 该 进程 的 存储 影像 ,以 供 检查 进程 终止 时 的 状态 ;Stop 表示 暂停 进程 ;Ign K 


示 忽 略 信号 。 


6.2 早期 信号 处 理 函 数 


signal 


621 siga 函数 实现 信号 的 三 种 处 理 方式 


signal 函数 是 早期 的 UNIX 信和 号 处 理 函数 .为 了 保证 程序 的 兼容 ,Linux 系统 也 支持 
signal 函数 ,其 函数 接口 规范 说 明 如 表 6. 2 所 示 。 
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表 6.2 signal 函数 的 接口 规范 说 明 
函数 名 称 signal 
函数 功能 信号 处 理 函 数 
头 文件 #include<signal. h> 
函数 原型 __sighandler_t signal(int signum, __sighandler_t handler); 


signum: 要 处 理 的 信号 
handler: 信号 处 理 函 数 


75— 1: 成 功 (该 信号 以 前 的 处 理 函 数 ) 
SIG_ERR: 出 错 


参数 


返回 值 


在 signal 函数 的 声明 中 ,出 现 了 一 个 新 的 类 型 _sighandler_t, 该 类 型 定义 位 于 /usr/ 
include/signal. h 头 文件 中 ,定义 如 下 : 

typedef void (* — sighandler t) (int); 

该 定义 语句 的 含义 是 : 定义 一 种 新 类 型 __sighandler, 这 是 一 种 函数 指针 ,这 种 函数 
返回 值 类 型 为 void 类 型 ,有 一 个 类 型 为 int 的 参数 。 

从 这 一 解释 来 看 ,signal 函数 在 安装 时 需要 使 用 此 类 型 的 函数 指针 作为 参数 ,并 且 当 
进程 调用 signal 函数 捕捉 信号 成 功 后 ,将 会 返回 signum 信号 之 前 的 处 理 函 数 ;如 果 进 程 
在 运行 过 程 中 收 到 信号 signum 时 ,将 会 转 去 执行 handler 函数 。 信 号 处 理 函数 除了 可 以 
让 程序 设计 者 自 定义 外 ,还 可 以 使 用 在 signal. h 中 定义 的 两 个 伪 函 数 SIG_DFL 和 SIG_ 
IGN, 表 示 错 误 的 宏 SIG_ERR 和 这 两 个 伪 函 数 的 定义 都 在 signal. h 头 文件 中 ,定义 如 下 : 


/* Fake signal functions */ 


# define SIG FRR (( sighandler t) -1) ^— /*Errorretum */ 
# define SIG DEL (( sighandler t) 0) /* Default action */ 
*define SIG IGN (( sighandler t) 1) /* Igore signal */ 


现在 就 可 以 通过 程序 示例 来 学 习 如 何 使 用 signal 函数 实现 对 信号 的 三 种 处 理 。 以 下 
三 个 示例 ,都 针对 信号 SIGINT 来 做 出 处 理 。 

1. 忽略 信号 

示例 程序 6. 1 实现 了 对 信号 SIGINT 的 忽略 。 


[示例 程序 6.1 ep signal IGN.c] 
# include< stdio.h» 
# include< unistd.h> 
# include< signal .h> 
void main() 
{ 
inti-5; 
signal(SIGINT,SIG IGN); 
printf ("waiting for signal..An"); 
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while(i> 0) 
{ 
sleep(1); 
i--; 


printf ("Now you can't stop this program by Ctrl+ c!\n"); 


) 


在 示例 程序 6. 1 中 ,首先 为 信号 SIGINT 安装 了 伪 处 理 函 数 SIG. IGN, while 循环 
中 ,每 过 一 秒 输出 一 次 提示 信息 ,总共 循环 5 次。 示例 程序 编译 后 运行 得 到 结果 如 下 : 


root@ubuntu:~ # goc exp signal IGN.c -o exp signal ign 
root@ubuntu:~ # ./exp signal ign 


waiting for signal... 

Now you can't stop this program by Ctrl+ c! // 输 入 ctrl+c 
^CNow you can't stop this program by Ctrl+ c! 

Now you can't stop this program by Ctrl+ c! // 输 入 ctrl+c 


^CNow you can't. stop this program by Ctrl+ c! 
Now you can't stop this program by Ctrl* c! 


rootGubuntu:^ # 

从 运行 结果 可 以 看 出 ,在 循环 运行 后 输入 Ctrl 十 c 已 不 能 再 终止 进程 , 因为 SIGINT 
信号 被 进程 忽略 了 。 

2. 捕捉 信号 


示例 程序 6. 2 使 用 signal 函数 捕捉 信号 SIGINT 的 处 理 函 数 。 


[示例 程序 6.2 exp signal CAP.c] 
# include< stdio.h> 

# include< unistd.h> 

# include< signal.h> 


void capture (int signum) 
t printf ("SIGINT is captured!'Nn"); } 


void main () 
( 
int i-5; 
signal (SIGINT, capture) ; 
printf ("waiting for signal..An"); 
while(i» 0) 
t 
sleep(1); 
qui 


printf ("waiting for SIGINP! Wn") 


fom 信号 


在 示例 程序 6.2 中 , 主 函 数 使 用 signal 函数 为 SIGINT 信号 安装 了 信号 处 理 函 数 
capture。 在 此 之 后 ,进程 收 到 SIGINT 信号 后 会 暂时 中 断 执行 , 转 去 执行 capture 函数 ， 
即 输出 “SIGINT is captured!”。 以 下 是 示例 程序 6. 2 编译 后 运行 的 结果 。 


root@ubuntu:~ # goc exp signal CAP.c -o exp signal cap 
root@ubuntu:~ # ./exp signal cap 

waiting for signal... 

waiting for SIGINT! 

waiting for SIGINT! / Ali ^ ctrl+ C 
^CSIGINT is captured! 

waiting for SIGINT! // 输 入 ctrl+ C 
^CSIGINT is captured! 

waiting for SIGINT! // 输 入 Ctrl+ C 
^CSIGINT is captured! 

waiting for SIGINT! 


3. 默认 处 理 
示例 程序 6.3 实现 了 对 SIGINT 信号 使 用 默认 方式 处 理 。 


[示例 程序 6.3 exp signal DEL.c] 
# includec stdio.h> 

# includec unistd.h> 

# include signal.h» 


void capthendfl(int signum) 

t 
printf("SIGINT is captured! n") ; 
signal (SIGINT, SIG DEI); 
printf ("SIGINT now is defaulted!Wn") ; 


void main() 
t 
int i-5; 
signal (SIGINT, capthendf1) ; 
printf ("waiting for signal..An"); 
while(i» 0) 
t 
sleep(1); 
gg 


printf ("waiting for SIGINT!An") ; 
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在 示例 程序 6. 3 中 ,首先 在 主 函数 中 使 用 signal 函数 将 进程 对 SIGINT 信和 号 的 处 理 设置 
为 捕捉 信和 号 的 处 理 方 式 ,信号 处 理 函 数 为 capthendfl。 如 果 在 运行 完 signal (SIGINT, 
capthendfl) 之 后 ,程序 收 到 了 SIGINT 信和 号 ,运行 控制 将 会 转 去 信号 处 理 函 数 capthendfl 
执行 ,该 函数 输出 信息 表示 接收 到 了 SIGINT 信号 ,然后 再 一 次 调用 了 signal 函数 将 对 
SIGINT 信号 的 处 理 方式 修改 为 以 默认 方式 处 理 。 以 下 是 示例 程序 6. 3 编译 后 运行 的 结 
果 , 第 二 次 输入 Ctrl 十 c 后 ,程序 被 SIGINT 信号 中 断 了 。 


root@ubuntu:~ # goc exp signal DFL.c -o exp signal dfl 
root (ubuntu: # ./exp signal dfl 

waiting for signal... 

waiting for SIGINT // 输 入 ctrl+c 
^CSIGINT is captured! 

SIGINT now is defaulted! 

waiting for SIGINT // 输 入 ctrl+c 
Ac 


622 sga 函数 存在 的 问题 


1. 信号 处 理 不 可 靠 

在 早期 的 signal 版 本 中 ,使 用 signal 安装 的 信号 处 理 函 数 类 似 于 一 个 报警 器 ,一 旦 有 
信号 触动 了 它 , 想 要 让 它 再 次 起 作用 ,都 必须 重新 设置 报警 器 为 监视 状态 ,因此 当时 的 信 
号 处 理 函 数 通常 具有 以 下 的 程序 结构 : 

void handler (int signo) 

{ 


signal (SIGINT,handler) 
idaz // 信 号 处 理 的 内 容 


这 样 的 程序 结构 ,在 进程 响应 了 信号 之 后 到 handler 函数 中 再 次 使 用 signal 安装 信 
号 处 理 函 数 之 前 ,是 一 段 危险 的 时 间 , 尽 管 这 段 时 间 非 常 短 。 在 这 期 间 如 果 程 序 再 次 收 到 
SIGINT 信号 ,程序 对 信号 的 处 理 方式 将 会 选择 系统 默认 的 方式 ,这 就 使 得 原 有 的 信号 处 
理 不 可 靠 。 

2. 获取 当前 信号 处 理 方式 

signal 函数 在 为 某 信号 安装 信号 处 理 函 数 的 同时 ,会 返回 进程 之 前 对 该 信号 的 处 理 
函数 ,如 果 需 要 获取 该 信号 当前 的 处 理 方式 ,可 以 使 用 示例 程序 6.4 中 的 代码 。 

[示例 程序 6.4 get_handler.c] 

# includec signal.» 

# includec stdlib.h» 

# include< stdio.h> 

# include< unistd.h» 


void main() 


. sighandler t handler; 

handler= signal (SIGINT,SIG IGN); 

if(handler-- SIG IGN) 
printf("IGNORE! Vn") ; 

else if (handler== SIG DEL) 
printf("DEFAUUTAn") ; 

else if(handler-- SIG FFR) 
printf ("ERRORI Vn") ; 

signal (SIGINT, handler) ; 

} 


从 示例 程序 6. 4 中 可 以 看 到 ,使 用 signal 函数 来 获取 当前 对 某 个 信号 的 处 理 函 数 时 ， 
必须 重新 安装 该 信号 ,因此 程序 中 使 用 变量 handler 接收 进程 对 信号 SIGINT 的 处 理 方 
式 , 并 且 在 程序 的 最 后 ,还 要 使 用 signal 函数 将 handler 重新 安装 为 SIGINT [i Ath Jl PR 
数 。 从 这 一 点 上 来 看 ,使 用 signal 获取 某 个 信号 当前 的 处 理 方式 是 一 件 很 麻烦 甚至 有 风 
险 的 事情 ,例如 在 两 次 signal 之 间 发 生 的 SIGINT 信号 有 可 能 被 忽略 掉 。 

3. 处 理 多 个 信号 

在 早期 的 UNIX 版 本 中 ,信号 是 不 可 靠 的 , 即 一 个 信号 发 生 了 ,但 进程 却 有 可 能 一 
直 不 知道 。 同 时 ,进程 对 信号 的 控制 能 力也 很 差 , 它 能 捕捉 信和 号 或 者 忽略 信号 ,但 却 无 
法 阻塞 信号 , 即 进程 不 想 忽 略 掉 信 号 ,希望 能 在 信号 发 生 时 记 住 它 ,等 处 理 完 其 他 更 重 
要 的 事 之 后 ,再 通知 进程 处 理 信号 。 而 这 一 功能 是 signal 函数 所 不 具备 的 , 它 无 法 阻塞 
信号 。 

其 次 在 进程 处 理 某 个 信号 时 ,如 果 该 信号 再 次 甚至 多 次 发 生 , 进 程 该 如 何 处 理 ? 当 
信号 发 生 时 ,如 果 进 程 正 在 处 理 read 之 类 的 I/O 交互 而 导致 进程 阻塞 ,此 时 又 该 如 何 
处 理 ? 当 从 信号 处 理 函 数 返 回 时 ,是 从 read 被 中 断 处 继续 读 操作 ,还 是 重新 读 取 缓冲 
区 的 内 容 ? 

以 上 问题 都 是 signal 函数 无 法 解决 的 ,为 了 保证 程序 的 可 移植 性 ,现在 大 多 数 Linux 
系统 并 不 使 用 signal 函数 来 处 理 信号 ,而 是 使 用 更 为 成 熟 的 sigaction 函数 。 


6.3 ”信号 处 理 函 数 一 一 sigaction 


signal 函数 的 使 用 方法 简单 ,但 并 不 遵循 POSIX 标准 ,在 各 种 类 UNIX 平台 上 的 实 
现 不 尽 相 同 ,因此 其 用 途 受 到 了 一 定 的 限制 。 而 POSIX 标准 定义 的 信号 处 理 接口 是 
sigaction 函数 。 
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sigaction 函数 的 功能 是 检查 或 修改 与 指定 信号 相关 联 的 处 理 动作 。sigaction 函数 
接口 规范 说 明 如 表 6. 3 所 示 。 
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表 6.3  sigaction 函数 的 接口 规范 说 明 
函数 名 称 sigaction 
函数 功能 信号 处 理 函 数 
头 文件 #include<signal. h> 
函数 原型 int sigaction(int signum. struct sigaction * action. struct sigaction * oldaction) ; 
signum; 要 处 理 的 信号 
参数 action: 信号 处 理 函 数 
oldaction: 之 前 的 信号 处 理 函数 
nini i m 


说 明 : 在 sigaction 的 定义 中 ,action 是 要 为 信号 signum 安装 的 信号 处 理 函 数 ， 
oldaction 用 于 接收 signum 之 前 的 处 理 函 数 。 在 使 用 时 ,action 或 oldaction 可 以 设置 为 
空 指针 。 当 action 为 空 , oldaction 非 空 时 ,表示 获取 signum 信号 的 处 理 方 式 ; 当 


oldaction 为 空 时 


,表示 只 按照 action 来 安装 signum 信和 号。 


在 函数 原型 中 ,struct sigaction 类 型 定义 在 sigaction. h 头 文件 中 ,具体 定义 如 下 : 


struct sigaction { 


union 
{ 


void 


. Sighandler t sa handler; 


(* sa sigaction) (int, siginfo t * , void * ); 


sa flags; 
(* sa restorer) (void); 


# define sa handler — sigaction handler.sa handler 

# define sa sigaction — sigaction handler.sa sigaction 

在 以 上 的 类 型 定义 中 ,sa_handler 8X sa. sigaction 用 于 接收 信号 处 理 函 数 ,两 者 使 用 
其 一 即 可 。 当 信号 处 理 函 数 需要 接收 附加 信息 时 ,必须 给 sa_sigaction 赋予 信号 处 理 函 
数 指针 ,同时 还 要 将 sa_flags 置 为 SA_SIGINFO; 如果 应 用 程序 只 需要 接收 信号 ,而 不 需 


要 接收 额外 信息 ， 


那 将 函数 指针 赋 给 sa handler 即 可 。sa_mask 表示 在 响应 信号 ,进入 信 


号 处 理 函 数 后 ,进程 需要 阻塞 对 哪些 信号 的 响应 。sa_flags 包含 了 许多 标志 位 ,可 以 通过 
它 来 设置 是 否 在 信号 响应 后 恢复 对 信号 的 默认 处 理 等 ,常用 的 选项 见 表 6. 4。 


表 6.4 sa flags 的 常用 选项 


选 项 


说 M 


SA_RESETHAND 


响应 信号 进入 处 理 函 数 入 口 时 ,将 该 信号 的 处 理 方式 重 置 为 SIG_DFL, 并 清除 
SA_SIFINFO 标志 


SA_RESTART 


被 此 信号 中 断 的 系统 调用 将 会 自动 重新 启动 ,例如 read ioctl 等 
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续 表 
选 项 说 上 明 
为 信号 处 理 函 数 提供 了 一 个 指向 siginfo 结构 的 指针 和 一 个 指向 进程 上 下 文 标 
SA_SIGINFO 识 符 的 指针 
SA_NODEFER 响应 信号 执行 其 处 理 函 数 时 ,系统 不 自动 阻塞 此 信号 ,除非 sa_mask 包括 了 此 信号 


编写 程序 时 ,可 以 使 用 给 sa_handler 成 员 赋 值 的 方式 蔡 换 signal 函数 来 安装 信号。 
示例 程序 6. 5 使 用 sigaction AROK EEÍX signal 函数 ,安装 信和 号 处 理 函 数 。 


[示例 程序 6.5 exp sigaction signal.c] 
# includec stdio.h» 
# includec signal.» 
# includec stdlib.h> 


void fun (int signo) 
I 
printf ("test for sigaction. Wn"); 


void main() 

{ 
struct sigaction action, oldaction; 
action.sa handler- fun; 
sigemptyset (&action.sa mask); 
action.sa flags- SA RESETHAND; 
Sigaction (SIGINT, &action, &oldaction) ; 
printf ("waiting for SIGINT.. An") 
while(1) 

pause(); 
) 


在 示例 程序 6. 5 中 ,使 用 sigaction 函数 为 信号 SIGINT 安装 了 处 理 函 数 fun, 并 使 用 
sigemptyset 函数 将 阻塞 信号 集 置 为 空 集 。 进 程 运 行 过 程 中 .响应 SIGINT 信号 后 ， 
SIGINT 信和 号 的 处 理 方式 重新 被 设置 为 默认 处 理 方式 。 该 程序 编译 后 运行 的 结果 如 下 
所 示 : 

root@ubuntu:~# goc exp sigaction signal.c -o sig signal 

rootQ$ubuntu:- # ./sig signal 


waiting for SIGINT... // 输 入 ctrl+c 
^Ctest for sigacticn. // 输 入 ctrl+ c 
^c 


从 运行 结果 中 能 够 看 到 ,程序 为 SIGINT 信号 安装 了 信号 处 理 函 数 之 后 ,只 响应 了 一 
次 SIGINT 信号 ,之 后 恢复 了 对 SIGINT 信和 号 的 默认 处 理 。 
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632 sgadion 函数 参数 的 说 明 


l. sa sigaction 
使 用 sigaction 安装 信和 号 ,还 可 以 使 用 sa. sigaction 成 员 来 接收 信号 处 理 函 数 ,sa_ 
sigaction 成 员 定义 如 下 : 


void (* sa sigaction) (int, struct siginfo * ,void * ); 


该 成 员 与 sa_handler 一 样 , 也 是 一 个 函数 指针 。 该 类 型 函数 具有 三 个 参数 , 第 一 个 
参数 说 明 要 安装 的 信号 ;第 二 个 参数 用 于 记录 导致 信号 产生 的 原因 、 类 型 等 信息 ;第 三 个 
参数 用 来 记录 信号 发 生 时 被 中 断 进程 的 上 下 文 环境 。 这 样 一 来 , 当 信号 产生 时 就 可 以 记 
录 关于 信号 的 众多 信息 。 示 例 程序 6. 6 使 用 sa_sigaction 来 接收 信号 处 理 函数 。 


[示例 程序 6.6 exp sigaction sa.c] 
# includec stdio.h> 

# include< signal.h> 

# include< stdlib.h> 


void fun(int signo,struct siginfo * info,void * context) 
{ 

Printf ("test for sigaction.\n"); 
} 


main() 

{ 
struct sigaction action, oldaction; 
Sigenptyset (&action.sa mask); 
action.sa flags- SA SIGINFO; 
action.sa sigaction- fun; 
sigaction (SIGINT, &action, &oldaction) ; 
printf ("waiting for SIGINT..An"); 
while(1) 

pauseQ ; 
) 


在 示例 程序 6. 6 中 ,程序 使 用 sa. sigaction 成 员 接 收 信号 处 理 函 数 fun, 并 将 sa. flag 
曾 为 SA_SIGINFO, 表 示 在 进程 运行 过 程 中 ,如 果 被 SIGINT 信号 中 断 , 则 响应 该 信号 ， 
进入 fun 函数 进行 处 理 , 并 且 同 时 将 信号 产生 的 原因 、 类 型 或 进程 的 上 下 文 环境 等 信息 
Cinfo 和 context 不 可 同时 使 用 ) ,分 别 从 参数 指针 info 和 context 传送 给 信号 处 理 函数 ， 
VA fun 函数 使 用 。 示 例 程 序 6. 6 的 运行 结果 如 下 : 

root@ubuntu:~ # goc exp sigaction sa.c -o sig sa 

rcotéubantur- £ ./sig sa 

waiting for SIGINT... // 输 入 ctrl+c 
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^Ctest for sigaction. // 输 入 ctrl+c 

^Ctest for sigaction. // 输 入 ctrltc 

ABRE 尽心 已 转 储 ) 

参数 context 可 以 被 强制 转换 为 ucntext. t 结构 体 类 型 ,用 于 标识 信号 传递 时 进程 的 
EFX. 

2. siginfo 

通常 使 用 sa handler 来 确定 信号 处 理 函 数 ,如 果 sigaction 结构 中 的 sa. flag 使 用 了 
SA_SIGINFO 标志 ,那么 就 使 用 sa_sigaction 确定 信号 处 理 困 数 。sa_sigaction 类 型 函数 
的 第 二 个 参数 类 型 为 struct siginfo, 该 结构 包含 了 信和 号 产生 原因 的 有 关 信 息 ,定义 于 
bits/siginfo. h 头 文件 中 ,在 其 定义 中 大 致 包括 以 下 内 容 : 


struct siginfo 
{ 
int si signo; /* Signal mmber */ 
int si errno; /* If non- zero, an ermo value associated with 
this signal, as defined in <ermo.h> */ 
int si code; /*Sigaloxe */ 
pid t si pid; /* Sending process ID* / 
uid t si uid; /* Sending process real user ID* / 
void * si addr; /* address that caused the fault * / 
int si status; /* exit value or signal number * / 
long si bend; /* band mmber for SIGFOLL* / 


从 siginfo 的 定义 可 以 获取 该 信号 产生 的 原因 以 及 发 送信 号 的 进程 ID .进程 真实 用 
P ID( 使 用 kill 发 送信 号 的 情况 )、 引 起 信号 的 错误 的 发 生地 址 (SIGSEGV)、 子 进程 
(SIGCHLD) 的 退出 状态 等 信息 ,这 些 信息 都 可 以 提供 给 信号 处 理 函 数 使 用 。 

3. sa_mask 

在 sigaction 结构 中 ,成 员 sa. mask 用 来 定义 在 执行 信和 号 处 理 函 数 时 要 阻塞 的 信号 集 
合 ,sa_mask 成 员 类 型 为 sigset_t, 即 信号 集 类 型 . 它 的 每 一 位 代表 一 种 信和 号。 为 什么 要 在 
响应 某 个 信号 时 阻塞 进程 对 其 他 信号 的 响应 呢 ? 

学 习 过 操作 系统 的 读者 应 该 对 进程 的 同步 互 斥 这 一 内 容 都 不 陌生 , 当 多 个 进程 争 用 
有 限 的 共享 资源 时 ,进程 必须 互 斥 地 使 用 共享 资源 。 例 如 有 多 个 进程 要 对 同一 个 文件 执 
行 写 操作 ,那么 互 斥 地 写 文 件 可 以 保证 写 入 的 数据 不 会 混乱 错误 。 信 号 处 理 程序 同样 也 
会 面临 这 样 的 问题 : 如 果 前 一 个 信号 SIGX 的 处 理 函 数 需要 对 某 个 文件 进行 写 操作 , 随 
后 紧 接 着 到 来 了 信号 SIGY ,其 处 理 程序 也 要 写 或 读 同 一 个 文件 ,此 时 就 有 可 能 发 生 以 下 
的 情况 : SIGX 在 写 某 一 条 记录 时 , 写 了 一 半 , 被 SIGY 打 断 ,SIGY 的 处 理 程序 继续 接着 
上 一 次 SIGX 信和 号 处 理 程 序 写 操作 的 位 置 写 人 数据 ,或 者 从 当前 读 写 指 针 位 置 读 出 指定 
大 小 的 数据 ,显然 写 人 或 读 出 的 数据 是 错误 的 数据 ,这 种 情况 称 为 数据 损毁 。 显 然 ,数据 
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损毁 是 需要 避免 的 情况 。 

要 解决 信号 处 理 函 数 所 导致 的 数据 损毁 问题 ,最 简单 的 办 法 就 是 阻塞 或 忽略 那些 有 
可 能 导致 问题 的 信号 ,这 种 阻塞 既 可 以 在 信号 处 理 时 实现 ,也 可 以 在 进程 中 实现 。 

如 果 希 望 一 个 信号 在 被 处 理 时 阻塞 另外 一 个 或 一 些 信号 ,可 以 将 需要 阻塞 的 信号 设 
置 在 sa mask 屏蔽 信号 集中 ,这 样 在 设置 信号 处 理 卫 数 的 时 候 ,被 屏 珊 的 信号 集合 将 会 
传递 给 sigaction 结构 。 

如 果 进 程 需要 阻塞 某 些 信号 ,可 以 使 用 函数 sigprocmask 来 设置 屏蔽 信号 集 。 
sigprocmask 因数 接口 规范 说 明 如 表 6.5 所 示 。 

表 6.5 sigprocmask 函数 的 接口 规范 说 明 


函数 名 称 sigprocmask 

函数 功能 查看 或 修改 当前 的 屏蔽 信号 集 

头 文件 € include signal. h> 

函数 原型 int sigprocmask(int how, sigset t * set, sigset t * oset); 
how: 修改 屏蔽 信号 集 的 方式 

参数 sigs: 本 次 要 按照 how 的 方式 操作 的 信号 集合 指针 
prev: 修改 前 的 屏蔽 信号 集 指针 

y 0: 成 功 

uim 一 1: 失败 


说 明 : 如 果 指 针 oset 非 空 ,那么 进程 当前 的 屏蔽 信号 集 就 会 通过 oset 返回 。 

指针 sec 为 空 时 ,不 修改 进程 当前 的 屏蔽 信号 集 ;set 非 空 时 ,how 的 取 值 才 有 意义 ， 
表示 如 何 修改 当前 的 屏蔽 信号 集 ,可 以 选择 SIG BLOCK,SIG UNBLOCK 或 SIG SET. 
具体 含义 如 表 6.6 所 示 。 


表 6.6  sigprocmask 更 改 屏蔽 信号 集 的 方法 


how 说 明 
SIG_BLOCK 向 屏蔽 信号 集中 增加 想 要 屏蔽 的 信号 ,指针 sec 指向 新 增 信号 的 集合 
SIG_UNBLOCK 从 屏蔽 信号 集中 减 去 不 想 要 屏蔽 的 信号 ,指针 set 指向 减 去 信号 的 集合 
SIG_SETMASK 将 屏蔽 信号 集 设置 为 指针 sec 所 指向 的 信号 集合 


示例 程序 6.7 使 用 sigprocmask 来 设置 进程 屏蔽 信号 集 。 


[示例 程序 6.7 exp sigoroc.c] 
# include< stdio.h» 

# include& stdlib.h» 

# include< unistd.h» 

# include« signal.h» 


int main() 
t 
sigset t set; 


Sigemptyset (&set) ; 
Sigaddset (&set, SIGINT) ; 
sigproamask(SIG BLOCK, &set, NULL) ; 


pause(); 
retum 0; 
) 
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在 此 示例 程序 中 ,使 用 函数 sigemptyset、sigaddset 将 set 设置 为 只 含有 SIGINT 信 
号 的 信号 集 , 随 后 使 用 sigprocmask 函数 设置 当前 进程 的 屏蔽 信号 集 。 其 运行 结果 如 下 : 


rootGubuntu:- # goc exp sigproc.c -o exp sigproc 
rootéubuntu:- $ ./exp sigoroc // 输 入 两 次 ctrl+c 后 输入 ctrl+\ 


“CC 人 ^\ (Bo E Fe) 


从 运行 结果 可 以 看 出 示例 程序 6. 7 在 运行 过 程 中 屏蔽 了 SIGINT 信和 号。 程序 中 所 使 
用 的 sigemptyset 和 sigaddset 函数 是 设置 屏蔽 信号 集 时 经 常 使 用 到 的 函数 , 除 此 之 外 在 
设置 信号 集 时 还 会 用 到 sigfillset 和 sigdelset 函数 ,它们 的 接口 规范 说 明 如 表 6.7 和 


表 6.8 所 示 。 
表 6.7 sigemptyset/sigfillset 函数 的 接口 规范 说 明 
函数 名 称 sigemptyset/sigfillset 
函数 功能 将 信号 集 置 为 空 集 /将 信号 集 置 为 全 集 
头 文件 # include< signal. h> 
int sigemptyset(sigset t * set); 
函数 原型 int sigfillset(sigset t * set); 
参数 set; 要 置 空 或 置 满 的 信号 集合 的 指针 
0: 成 功 
EHE 一 1: 失败 
表 6.8 sigaddset/sigdelset 函数 的 接口 规范 说 明 
函数 名 称 sigaddset/sigdelset 
函数 功能 在 信号 集中 增加 /减少 一 个 信号 
头 文件 # include< signal. h> 
int sigaddset(sigset_t * set, int signo); 
ENRE int sigdelset(sigset t * set. int signo); 
参数 set: 待 修改 的 信号 集 的 指针 
signo; 要 增加 /减少 的 信号 
返回 什 0: 成 功 


一 1: 失败 
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6.4 信号 其 他 相关 函数 


641 Kill 与 rase 
产生 信号 的 一 种 方法 是 由 某 个 进程 调用 kill 函数 发 送信 号 给 指定 进程 或 进程 组 ,kill 
也 是 一 条 Shell 命令 ,例如 在 Shell 环境 中 执行 命令 : 
kill - 9 3234 
表示 向 进程 ID 为 3234 的 进程 发 送 一 个 编号 为 9(SIGKILL) 的 信和 号。 在 编写 程序 时 ,kill 
函数 的 接口 规范 定义 如 表 6. 9 所 示 。 
36.9. kill 函数 的 接口 规范 说 明 


函数 名 称 kill 

函数 功能 向 进程 发 送 一 个 信号 

头 文件 #include< signal. h> 

函数 原型 int kill(pid t pid, int signo); 
pid: 目标 进程 PID 

iid signo: 要 发 送 的 信号 

3 0; 成 功 

mim 一 1: 失败 


说 明 : 根据 调用 kill 函数 时 参数 pid 的 值 ,系统 将 会 把 信号 发 送 给 不 同 的 进程 或 进 
程 组 。 


pid>0 时 ,系统 将 信号 signo 发 送 给 进程 PID 为 pid 的 进程 。 

pid—0 时 ,系统 将 信号 signo 发 送 给 和 当前 进程 在 同一 进程 组 的 所 有 进程 ,这 要 
求 当前 进程 具有 向 其 他 同 组 进程 发 送信 号 的 权限 。 

pid — — 1 时 ,系统 将 信号 发 送 给 调用 进程 有 权限 向 其 发 送信 和 号 的 所 有 进程 。 
pid<0 时 ,将 信和 号 发 送 给 进程 组 号 PGID 为 pid 绝对 值 , 且 当前 进程 有 权限 向 其 发 
送信 号 的 所 有 进程 。 

示例 程序 6. 8 展示 了 如 何 使 用 kill 函数 来 向 某 个 指定 进程 发 送信 号 。 

[示例 程序 6.8 exp kill.c] 

# include< stdio.h» 

# includec stdlib.h» 

# include« signal.h» 


void fun (int signo) 

{ 
printf ("process capture SIGINI\n"); 
signal (SIGINT, SIG DEL); 


main() 


int pid; 
if((pid- fork())-—- 1) 
i 
perror ("fork"); 
exit (ŒXIT_FAIIUFE); 
} 
else if(pid-- 0) 
t 
signal (SIGINT, fun); 
printf ("child %d waiting for parent %d sent signal\n",getpid(), 
getppid(); 
pause(); 
printf ("child waiting for SIGINT! An") ; 
pause(); 


sleep(1); 

printf ("parent $d will sent a signal to child $dWn",getpid() ,pid) ; 
kill(pid,SIGINT) ; 

wait (NULL) ; 


} 


在 示例 程序 6. 8 中 ,程序 使 用 fork 函数 创建 了 一 个 子 进程 。 在 随后 的 代码 中 , 子 进 
程 使 用 signal 函数 为 SIGINT 信号 安装 了 处 理 函 数 , 紧 接着 调用 pause 函数 挂 起 子 进程 ， 
等 待 接收 信号 。 父 进程 在 休眠 一 秒 后 调用 kill 函数 向 子 进程 发 送 SIGINT fi. Ttf 
接收 到 SIGINT 信号 后 ,执行 信号 处 理 函 数 ,输出 “process capture SIGINT”, 随 后 将 对 
SIGINT 信号 的 处 理 修改 为 默认 处 理 方式 。 程 序 运 行 结果 如 下 所 示 : 


root(ubuntu:» # goc exp kill.c -o exp kill 
root@ubuntu:~ # ./exp kill 

child 3562 waiting for parent 3561 sent signal 
parent 3561 will sent a signal to child 3562 
prooess capture SIGINT 

child waiting for SIGINT /| 输入 ctrltc 
^ 


需要 说 明 的 是 ,尽管 在 示例 程序 6. 8 中 , 父 进程 发 送 SIGINT 信和 号 给 子 进程 ,但 这 并 
不 是 说 发 送信 号 的 进程 与 接收 信号 的 进程 之 间 一 定 要 具有 亲缘 关系 。 进 程 在 调用 Kill K 
数 向 其 他 进程 或 进程 组 发 送信 号 时 ,只 要 求 发 送信 号 的 进程 具有 对 接收 信号 进程 发 送信 
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号 的 权限 即 可 。 

raise 函数 也 可 以 向 进程 发 送信 号 ,与 kill 函数 不 同 的 是 ,raise 函数 发 送信 号 的 目标 
进程 是 确定 的 ,是 向 调用 raise 函数 的 进程 自己 发 送 一 个 信号 。 因 此 使 用 raise 函数 时 , 通 
常 说 进程 自 举 了 一 个 信号 。 除 此 之 外 ,raise 还 可 以 用 来 对 线程 发 送信 号 。raise 函数 的 原 
型 定义 如 表 6. 10 Bron. 


表 6.10 raise 函数 的 接口 规范 说 明 


函数 名 称 raise 参数 signo: 要 发 送 的 信号 
函数 功能 自 举 一 个 信号 0; 
: EE €— 
头 文件 # include- signal. h> 一 1: 失败 
函数 原型 int raiseCint signo) ; 


对 于 单线 程 程序 来 说 ,在 程序 代码 中 使 用 语句 “raise(SIGUSER1);” 相 当 于 使 用 语句 
“kill(getpid() ,SIGUSER1);”。 对 多 线程 程序 来 说 ,raise 函数 只 将 信号 发 送 给 调用 raise 
的 线程 。 如 果 raise 函数 发 送 的 信号 处 理 策略 是 捕捉 信号 ,那么 只 有 当 信号 处 理 函 数 结束 
返回 进程 后 ,raise 函数 才 会 返回 。 
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日 常生 活 中 我 们 经 常会 使 用 定时 器 来 提醒 自己 在 指定 的 时 间 要 做 某 一 件 事 , 例 如 通 
常 在 工作 日 我 们 会 设 定 一 个 闹钟 在 特定 时 间 提 醒 我 们 按时 起 床 。Linux 系统 中 的 函数 
alarm 就 是 这 样 一 个 计时 器 函数 ,调用 它 时 也 就 是 设 定 了 指定 的 时 间 , 当 指定 时 间 到 达 
后 ,系统 将 会 向 调用 alarm 的 进程 发 送 一 个 SIGALRM 信号 。SIGALRM 信号 的 默认 处 
理 是 终止 进程 ,但 是 通常 进程 都 会 为 该 信号 安装 相应 的 信号 处 理 函 数 ,从 而 可 以 实现 定时 
执行 处 理 的 功能 。alarm 函数 的 接口 规范 说 明 如 表 6. 11 所 示 。 
表 6.11 alarm 函数 的 接口 规范 说 明 


函数 名 称 alarm 
函数 功能 设置 计时 器 
头 文件 £ include unistd. h> 
函数 原型 int alarm(int seconds) ; 
参数 seconds: 定时 器 设置 的 秒 数 
返回 什 0: 之 前 未 调用 过 alarm 
20: 上 一 次 调用 alarm 时 设置 的 秒 数 余 留 的 时 间 


与 现实 不 同 的 是 ,每 个 进程 只 能 有 一 个 闹钟 时 钟 ,因此 如 果 在 当前 调用 alarm 之 前 曾 
经 调用 过 alarm 函数 ,那么 之 前 设置 的 闹钟 就 会 失效 ,只 返回 上 次 所 定时 间 到 当前 余 留 下 
的 秒 数 , 曾 钟 将 被 本 次 的 调用 重 置 。 当 上 次 设置 的 闹钟 时 间 未 满 时 ,再 次 调用 alarm, Jf 
且 将 参数 seconds 设置 为 0, 那 么 之 前 设置 的 闹钟 将 被 取消 。 从 这 一 机 制 也 能 得 出 结论 ， 
如 果 要 对 SIGALRM 信号 做 出 响应 ,那么 必须 在 调用 alarm. 函数 之 前 安装 SIGALRM fii 
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号 的 处 理 函 数 。 
pause 函数 是 信号 机 制 中 一 个 经 常 被 使 用 到 的 系统 调用 ,在 前 面 其 他 程序 中 也 使 用 
过 。 顾 名 思 义 ,pause 函数 的 作用 是 使 调用 它 的 进程 主动 进入 阻塞 状态 ,该 进程 会 被 之 后 
发 送 来 的 信号 唤醒 。 这 样 看 来 ,如 果 在 程序 中 使 用 了 pause 函数 ,但 该 进程 始终 未 接收 到 
任何 信号 ,这 将 导致 进程 被 永久 地 处 于 阻塞 状态 。pause 函数 的 接口 规范 说 明 如 表 6. 12 
所 示 。 
表 6.12 pause 函数 的 接口 规范 说 明 


函数 名 称 pause 函数 原型 int pause(void) ; 
函数 功能 挂 起 一 个 进程 参数 无 
头 文件 # include unistd. h> 返回 值 =j 


从 pause 函数 的 原型 描述 中 能 看 到 ,pause 函数 没有 参数 ,并 且 无 论 执行 情况 如 何 , 都 
只 有 一 个 返回 值 一 1。 当 执行 pause 函数 后 ,进程 将 自身 挂 起 ,直到 进程 收 到 某 个 信号 , 转 
去 执行 该 信号 的 处 理 函 数 。 当 该 信号 处 理 完毕 后 返回 进程 , pause 天 数 同时 返回 ,此 时 
pause 困 数 除了 返回 一 1 外 ,还 会 将 errno 设置 为 EINTR. 
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在 前 面 的 章节 里 ,示例 程序 经 常会 使 用 sleep 函数 ,sleep 可 以 使 程序 在 运行 过 程 中 暂 
时 休眠 一 段 时 间 ,实际 上 在 休眠 的 时 间 里 是 进程 将 自己 挂 起 了 。 这 样 看 来 ,使 用 alarm 和 
pause 因数 也 可 以 实现 sleep 函数 的 功能 。 示 例 程序 6. 9 使 用 alarm 和 pause PR ice S: 34 
T sleep 函数 的 功能 。 


[示例 程序 6.9 mysleep.c] 
# include< signal.h> 

# include< stdio.h> 

# include< stdlib.h> 

# include< unistd.h> 


void sig alam(int signo) 
t 

printf ("Time is up! n"); 
} 


main(int argc, char * argv[]) 
i 
int seconds; 
if (argc!=2) 
f 
printf ("Usage error,please set seconds! Wn") ; 
exit (EXIT_FATIIFE); 
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seconds- atoi (argv[1]); 
if (signal (SIGAM, sig alarm)-— SIG FFR) 
exit(EXIT FAIIDRE); 
alarm(seconds) ; 
pause); 
exit (alarm(0)) ; 
return 0; 
) 


在 示例 程序 6. 9 中 ,首先 使 用 signal 函数 为 SIGALRM 信号 安装 处 理 程序 ;随后 调 
用 alarm 函数 ,根据 命令 行 中 的 参数 设 定 闹钟 时 间 ; 紧 接着 调用 pause 函数 挂 起 进程 ,等 
待 接收 信号 ;定时 时 间 到 后 ,进程 响应 SIGALRM 信和 号 ,执行 信号 处 理 函 数 ,输出 “Time is 
up!”, 然 后 返回 到 进程 继续 执行 。 

由 于 该 进程 并 没有 屏蔽 其 他 信号 ,有 可 能 在 进程 被 阻塞 的 时 间 段 里 收 到 了 其 他 信和 号 
导致 进程 结束 ,因此 当 标准 输出 设备 上 没有 出 现 SIGALRM 信号 的 处 理 程序 输出 的 内 容 
时 ,表示 有 其 他 信号 结束 了 进程 ,闹钟 还 没有 到 时 间 。 该 程序 运行 结果 如 下 所 示 : 

root@ubuntu:~ # goc mysleep.c - o mysleep 

root@ubuntu:~ # ./mysleep 2 

Time is up! 

示例 程序 6. 9 只 是 sleep 函数 的 一 个 简单 模拟 ,实际 的 sleep 函数 远 比 这 个 设计 要 复 
杂 得 多 。 在 这 个 程序 中 ,尽管 实现 了 部 分 sleep 函数 的 功能 ,但 它 存 在 着 一 些 问题 。 

第 一 ,一 个 进程 只 有 一 个 alarm 时 钟 , 当 使 用 alarm 来 实现 sleep 函数 的 功能 时 ,也 就 
意味 着 若 该 进程 同时 要 实现 定时 这 一 功能 ,程序 设计 将 要 复杂 得 多 。 

第 二 ,如 果 进程 原先 有 对 SIGALRM rp CTS Ab XI PR CLIE AAE alarm 来 实现 sleep 
的 功能 ,有 可 能 导致 对 SIGALRM 信号 的 处 理 被 改写 。 这 种 情况 下 需要 保留 原先 对 
SIGALRM 信号 的 处 理 函数 ,并 且 保 存 signal 函数 的 返回 值 ,在 模拟 sleep. 函数 的 处 理 函 
数 返回 前 复位 对 SIGALRM 信号 的 处 理 。 

第 三 ,调用 alarm 函数 和 pause 函数 的 操作 并 不 是 原子 操作 ,由 于 Linux 是 一 个 多 进 
程 的 操作 系统 ,一 个 繁忙 的 系统 有 可 能 导致 alarm 函数 和 pause 函数 操作 之 间 的 时 间 间 
隔 超过 了 alarm 所 设 定 的 时 间 。 这 样 一 来 ,pause 函数 将 会 在 SIGALRM 信号 到 来 之 后 
才 得 以 执行 ,如 果 没 有 其 他 信号 唤醒 或 结束 进程 ,进程 将 被 永久 挂 起 。 


6.5 小 结 


进程 在 Linux 系统 中 运行 时 有 可 能 受到 各 种 信号 的 影响 ,信号 是 一 种 软件 中 断 , 它 提 
供 了 一 种 处 理 异 步 事 件 的 方法 ,也 是 唯一 的 进程 间 异 步 通 信 方 式 。 在 Linux 系统 中 ,根据 
POSIX 标准 扩展 以 后 的 信号 机 制 ,不 仅 可 以 用 来 通知 某 个 进程 发 生 了 什么 事件 ,还 可 以 
给 进程 传递 数据 。 

本 章 介 绍 了 信号 的 概念 、 种 类 、 来 源 ,说 明了 可 靠 信 号 与 不 可 靠 信 号 的 差别 ,同时 也 介 
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绍 了 信和 号 的 三 种 处 理 方式 : 忽略 信和 号、 捕捉 信号 和 默认 处 理 。 为 了 实现 这 些 策略 ,可 以 使 
用 signal 函数 或 sigaction 函数 来 设置 不 同 信号 的 处 理 策略 。 其 中 ,signal 函数 是 早期 使 
用 的 信号 处 理 函 数 ,使 用 时 存在 着 一 定 的 问题 ,因此 现在 推荐 使 用 sigaction 函数 来 处 理 
fit. 

本 章 还 介绍 了 信号 机 制 中 经 常会 用 到 的 kill, raise .alarm 和 pause 函数 。 最 后 使 用 
alarm 和 pause PK Zi, fij C HE BS 0L Y sleep 函数 的 功能 ,并 指出 其 中 存在 的 问题 。 


习 题 

一 、 填空 题 

1. 在 实际 应 用 中 ,一 个 用 户 进程 常常 需要 对 多 个 信号 做 出 处 理 。 为 了 方便 对 多 个 信 
号 进行 处 理 , 在 Linux 系统 中 引入 的 概念 。 

2. 进程 可 以 忽略 大 部 分 信号 ,除了 和 nu. 

3. 在 kill(pid. signum) ŽC. ,pid>0 表示 

4。Ctrl 十 \ 发 送 一 个 信号 。 

5. SIGHUP 信号 的 作用 是 ,SIGCONT 信号 的 作用 是 f 

二 、 简 答题 


1. 为 什么 说 信号 机 制 是 一 种 异步 通信 方式 ? 

2. 有 哪些 事件 或 情况 会 产生 信号 ? 

3. 什么 是 可 靠 信号 和 不 可 靠 信 号 ? 

三 、 编 程 题 

1. 为 SIGUSR1 信号 安装 一 个 处 理 函 数 , 当 捕捉 到 该 信号 时 ,显示 当前 的 系统 时 间 。 
用 raise 发 送信 号 测试 是 否 成 功 。 

2. 编写 一 个 程序 ,将 SIGINT 信号 的 处 理 方式 依次 设置 为 忽略 .捕捉 到 SIGINT 后 
执行 func 函数 .默认 方式 。 
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7.1 选择 进程 间 通 信 方 式 


在 第 4 章 中 学 到 的 内 容 可 以 帮助 我 们 在 系统 中 创建 多 个 进程 ,如 果 这 多 个 进程 之 间 
是 有 联系 的 ,运行 过 程 中 需要 相互 通信 和 的话, 该 怎样 做 才能 让 进程 向 其 他 进程 发 送信 息 呢 
(例如 经 常 使 用 的 通信 软件 QQ)? 这 就 涉及 进程 的 通信 。 进 程 通信 是 指 不 同 进程 间 传 播 
信息 或 交换 数据 ,通信 的 目的 通常 是 为 了 实现 数据 传输 、 共 享 数据 、 通 知 时 间 、 资 源 共 享 或 
进程 控制 。 进 程 间 通信 的 方式 包括 管道 \ 信 和 号、 共享 内 存 、 消 息 队 列 \ 信 号 量 、 套 接 字 , 广 义 
来 看 ,文件 也 可 以 实现 进程 间 通信 。 本 章 首 先 来 学 习 在 同一 台 主 机 上 要 实现 一 个 进程 向 
另 一 个 进程 发 送信 息 可 以 有 哪些 做 法 。 

假定 一 个 需要 实现 进程 间 通 信 的 场景 : 现在 需要 实现 一 个 产生 随机 数 的 服务 器 
(Server) ,多 个 客户 端 (Client) 进 程 将 会 和 服务 器 通信 ,每 个 客户 端 每 次 和 服务 器 通信 读 
取 一 个 随机 数 。 本 节 分 别 使 用 文件 和 管道 来 实现 服务 器 和 客户 端 之 间 的 通信 。 
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在 多 个 进程 使 用 文件 进行 通信 的 方式 中 ,服务 器 进程 和 客户 端 进程 可 以 提前 约定 好 
通信 文件 的 名 称 , 例 如 可 以 将 文件 名 称 写 人 一 个 特殊 的 头 文件 中 供 双 方 进程 引用 。 使 用 
文件 实现 进程 通信 的 基本 思想 是 : 服务 器 进程 将 随机 数 写 入 文件 ;客户 端 进程 从 文件 中 
读 出 随机 数 。 当 然 这 要 求 双方 进程 对 该 文件 都 具有 相应 的 使 用 权限 。 程 序 代码 如 示例 程 
序 7.1 所 示 , 示 例 程 序 7. 1-1 为 服务 器 代码 ,示例 程序 7. 1-2 为 客户 端 代码 。 


[示例 程序 7.1-1 om file- server.c] 
# include< fentl.h» 

# include< stdio.h> 

# include< stdlib.h» 

# include< string.h> 

# include< time.h» 


main(int argc, char * argv[]) 
1 

int fd; 

inti; 

time t now; 
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long randata; 
char * message; 
char temp[64]- (0); 
if(argci- 2) 
t 
printf ("errror usage!\nusage: server filename Wn"); 
exit(EXIT FAIRE); 
} 
if ((fd= open (argv[1],0_CREAT|O WRONLY|O TRUNC,0644))==- 1) 
t 
perror ("open"); 
exit(EXIT FAIIDFE); 
$ 
while(1) 
t 
srandam (time (&now) ) ; 
randata- random(); 
temp[63]- 'N0'; 
i-6; 
while (randata» 0) 
t 
tenp[i- - ]- randata$10* 48; 
randata/- 10; 
) 
message tempt i+ 1; 
if ((lseek(fd,0,SEEK_SET))==- 1) 
t 
perror ("1seek") ; 
exit(EXIT FAILURE); 
) 
if (write (fd,message, strlen (message) )- — - 1) 
í 
perror ("write"); 
exit(EXIT FAILURE); 
} 
sleep(1); 


} 


在 服务 器 代码 中 ,进程 打开 命令 行 参数 指定 的 文件 ( 若 文件 不 存在 , 则 创建 该 文件 )， 
每 隔 一 秒 , 服 务 器 进程 产生 一 个 随机 数 ,将 其 转换 为 字符 型 的 数字 ;随后 将 文件 的 读 写 指 
针 设 置 在 文件 开始 处 ,将 字符 型 数字 写 人 文件 中 。 


[示例 程序 7.1-2 om file client.c] 
# include< stdio.h» 
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# include stdlib.h» 
# include fcntl.h» 


main(int argc, char * argv[]) 
1 
int fd,len; 
char buf [128]; 
if(argc!=2) 
{ 
printf ("error usage!\nusage: client filename"); 
exit(EXIT FAILURE) ; 
) 
if((fd-open(argv[1],O RDONLY))-- - 1) 
t 
perror ("open") ; 
exit(EXIT FAILURE); 
) 
while((len- read (fd, buf, 128) )> 0) 
t 
write (l,buf,len- 1); 
) 
close (fd); 
} 


客户 端 代码 中 ,进程 打开 同一 文件 ,从 文件 中 读 出 数据 ,显示 在 标准 输出 设备 上 。 每 
个 客户 端 进程 会 读 取 一 条 数据 ,由 于 服务 器 进程 写 人 的 是 随机 数 ,因此 每 个 客户 端 进程 读 
到 的 数据 都 不 一 样 。 

分 别 编译 服务 器 进程 和 客户 端 进程 后 运行 ,while 的 条 件 为 1, 服务 器 程序 将 会 一 直 
运行 ,因此 客户 端 程序 运行 结束 后 ,需要 使 用 kill 命令 终止 服务 器 进程 的 执行 。 客 户 端 程 
序 每 执行 一 次 将 会 读 取 一 条 数据 ,运行 结果 如 下 : 

root@ubuntu:~ $ gcc omme file- server.c - o server 

rootGubuntu:-» $ gcc omm file- client.c -o client 

root8ubuntu:^ # ./server test& 

[1] 3999 

root&ubuntu:^ # ./client test 

1285529497root&ubuntu:- # ./client test 

2057940085root&ubuntu:^ # ./client test 

114929?523rootGubuntu:- # kill — 9 3999 

u+ 已 杀 死 -/server test 


使 用 文件 作为 工具 实现 进程 间 通信 有 以 下 几 点 需要 注意 : 
CD 通信 双方 的 进程 必须 具有 相应 的 权限 。 在 示例 程序 7. 1 中 ,服务 器 进程 创建 了 
通信 用 的 文件 , 它 需 要 具有 该 文件 的 写 权 限 , 并 给 其 他 用 户 分 配 文件 的 读 权限 。 如 果 在 程 
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序 中 加 入 控制 ,使 客户 端 进程 和 服务 器 进程 同属 一 个 进程 组 ,那么 可 以 只 为 同 组 用 户 分 配 
读 权限 ,禁止 其 他 用 户 访问 文件 。 

(2) 多 个 客户 端 程序 可 以 同时 打开 文件 ,从 文件 中 读 取 数据 。 客 户 端 程序 和 服务 器 
程序 可 以 同时 打开 文件 ,所 以 客户 端 进程 如 果 打开 文件 的 时 间 不 合适 ,服务 器 进程 正好 将 
读 写 指针 重新 设置 在 了 文件 的 起 始 处 ,那么 客户 端 进程 有 可 能 读 不 到 数据 。 

(3) 当 多 个 客户 端 进程 打开 文件 读 取 数 据 时 ,记录 随机 数 的 文件 就 成 了 竞争 资源 ,而 
服务 器 进程 和 这 多 个 客户 端 进程 必须 互 斥 地 使 用 文件 才能 保证 所 读数 据 的 正确 性 。 因 此 
在 实际 使 用 这 种 方式 进行 进程 间 通 信 时 ,还 需要 使 用 某 种 方法 来 避免 多 个 进程 同时 使 用 
文件 ,例如 可 以 给 文件 加 锁 或 使 用 信号 量 来 控制 进程 读 写 文件 。 
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管道 也 可 以 实现 服务 器 进程 和 客户 端 进程 的 通信 ,由 于 通信 的 进程 间 通 常 不 存在 亲 
缘 关系 ,所 以 这 一 节 中 选择 命名 管道 来 实现 服务 器 和 客户 端的 通信 。 具 体 做 法 是 : 服务 
器 进程 将 数据 数 写 人 管道 ,客户 端 进程 从 管道 中 读 出 数据 并 显示 在 标准 输出 设备 上 。 示 
例 程序 7. 2 是 使 用 命名 管道 实现 进程 间 通 信 的 例子 ,其 中 示例 程序 7. 2-1 为 服务 器 程序 
代码 ,示例 程序 7. 2-2 为 客户 端 程序 代码 。 


[示例 程序 7.2- 1 omm fifo- server.c] 
# include< fcntl.h> 

# include< stdio.h> 

# include< stdlib.h> 

# include< string.h> 

# include< time.h> 


main(int argc, char * argv[]) 
i 
int fd; 
int i; 
time t now; 
long randatay 
char * message; 
char temp[64]- (0); 
if(argc!- 2) 
í 
printf ("errror usag!\nusage: server fifoname\n"); 
exit (EXIT FAILURE); 
$ 
unlink(argv[1]); 
if (kfifo(argv[1],0644)-— - 1) 
{ 
Perror ("nkfifo") ; 
exit(EXIT FAIHEE); 
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} 
if((fd-open(argv[1],O WRONLY))-— - 1) 
t 
perror ("open"); 
exit(EXIT FATIIRE) ; 
b 
while(1) 
t 
random (cime (&now) ) 7 
randata- randam() ; 
i-6; 
temp[63]- '\0'; 
while (randata» 0) 
t 
temp[i- - ]- randatat10* 48; 
randata/- 10; 
) 
message tempt i+ 1; 
if (write (fd, message, strlen (message) )- — - 1) 
1 
perror ("write"); 
exit (EXIT FAILURE); 
} 
sleep(1); 


) 


在 服务 器 代码 中 ,进程 按照 命令 行 参数 指定 的 文件 名 称 创 建 命名 管道 ,并 分 配 相 应 的 
权限 ,保证 客户 端 进程 有 足够 的 权限 访问 命名 管道 。 管 道 创 建成 功 后 ,服务 器 进程 产生 随 
机 数 写 人 管道 中 ,等 待 客户 端 进程 来 读 取 。 


[示例 程序 7.2-2 omm fifo client.c] 
# includec stdio.h> 

# includec stdlib.h> 

# include< fcntl.h> 


main(int argc, char * argv[]) 
t 
int fd,len; 
char buf [128]; 
if(argc!- 2) 
€ 
printf ("error usage!\nusage: client filename"); 
exit(EXIT FAILURE) ; 
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if((fd-cpen(argv[1],0 RDONLY))-—- 1) 
{ 


perror ("open") ; 
exit(EXIT FAIRE) ; 
) 
if((en- read (fd,buf, 128) )> 0) 
t 
write(l,buf,len- 1); 
) 
close(fd); 
) 
客户 端 进程 打开 指定 的 管道 ,从 管道 读 端 读 取 数 据 显 示 在 标准 输出 设备 上 。 这 种 方 
式 的 客户 端 程序 与 示例 程序 7. 1-2 的 客户 端 程序 类 似 , 不 同 之 处 在 于 由 于 服务 器 进程 一 
直 在 后 台 运 行 ,因此 只 要 客户 端 进程 循环 读 入 数据 ,客户 端 程序 就 无 法 停止 。 因 此 在 本 例 
中 ,客户 端 程序 只 读 取 数据 一 次 。 分 别 将 服务 器 和 客户 端 程序 编译 后 ,运行 结果 如 下 
所 示 : 
root@ubuntu:~ # goc ommu- fifo- server.c - o server 
rootGubuntu:^ # goc omm fifo- client.c -o client 
rootGubuntu:^ # ./server test& 
[1] 4019 
root@ubuntu:~ # ./client test 
1151872root&ubuntu:- $ 
up ” 断 开 的 管道 ./server test 
使 用 命名 管道 实现 进程 间 通信 有 以 下 几 点 需要 注意 : 
(1) 双方 进程 要 具有 使 用 命名 管道 的 相应 权限 。 在 示例 7. 2 中 ,命名 管道 文件 由 服 
务 器 程序 创建 ,并 给 其 他 用 户 分 配 了 读 权限 ,保证 客户 端 程序 能 够 使 用 命名 管道 的 读 端 。 
(2) 命名 管道 虽 有 文件 之 名 , 却 无 文件 之 实 , 它 实际 上 是 内 核 区 的 一 块 队列 缓冲 区 。 
只 有 读 写 进程 打开 了 管道 后 ,管道 中 的 数据 才 有 意义 。 当 管道 不 再 被 使 用 , 留 在 管道 里 的 
数据 将 不 复 存在 ,这 一 点 与 使 用 文件 通信 不 同 。 
(3) 管道 是 一 个 队列 ,多 个 客户 端 进程 不 能 同时 去 读 取 管道 中 的 数据 。 服 务 器 进程 
从 管道 的 写 端 写 和 数据 , 排 在 读 端 的 队 首 读 进程 从 管道 读 端 将 管道 前 128 个 字 节 的 数据 
取 走 。 因 此 只 有 写 进 程 不 断 地 写 入 数据 ,才能 保证 每 个 客户 端 进程 都 能 取 到 数据 。 
CD 示例 程序 7.2 中 ,服务 器 程序 和 客户 端 程序 分 别 连接 管道 的 写 端 和 读 端 ,因此 不 
存在 冲突 。write 和 read 函数 都 是 原子 操作 ,这 样 一 来 ,不 存在 write 执行 到 一 半 时 被 
read 函数 打 断 的 情况 ,因此 不 会 读 到 不 完整 的 数据 。 


721 什么 是 共享 内 存 
dE 7.1. 2 节 的 示例 程序 中 ,服务 器 进程 使 用 write 函数 将 数据 从 内 存 复制 到 命名 管 
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道 对 应 的 内 核 缓冲 区 中 ,客户 端 进程 使 用 read 函数 从 管道 中 读 出 数据 。 在 这 个 过 程 中 ， 
服务 器 和 客户 端 进程 各 自 读 、 写 内 存 一 次 ,并 且 需 要 从 访问 用 户 空间 的 状态 切换 到 访问 内 
核 空间 的 状态 。 有 没有 办 法 能 让 读 写 操作 的 次 数 减少 ,或 者 让 读 写 操作 只 在 用 户 空间 运 
行 , 让 进程 通信 的 效率 得 以 提升 呢 ? 有 ! 答案 是 使 用 共享 内 存 。 

共享 内 存 是 System V 的 一 种 进程 间 通 信 机 制 , 它 的 存在 不 依赖 于 使 用 它 的 进程 是 
和 否 存在 ,可 以 把 它 看 作 是 系统 的 一 种 IPC 资源 。 进 程 可 以 使 用 共享 内 存 的 ID 连接 到 某 
共享 内 存 段 ,获得 指向 此 段 的 指针 来 使 用 共享 内 存 。 

共享 内 存 的 使 用 原理 如 图 7. 1 所 示 。 在 图 中 可 以 看 到 ,共享 内 存 机 制 允许 两 个 或 更 
多 的 进程 共享 使 用 同一 段 物 理 内 存 , 具 有 使 用 权限 的 进程 可 以 将 共享 内 存 映 射 为 自己 空 
间 的 一 部 分 。 因 此 ,图 中 的 共享 内 存 段 既 是 进程 Pl 地 址 空间 的 一 部 分 ,也 是 进程 P2 地 
址 空间 的 一 部 分 。 这 样 一 来 ,共享 内 存 就 成 为 一 种 公用 资源 ,所 有 使 用 了 该 共享 内 存 的 进 
程 都 可 以 方便 地 读 出 其 中 的 数据 ,也 可 以 将 数据 写 和 共享 内 存 。 在 上 一 节 所 讲 的 C/S 结 
构 的 例子 中 ,如 果 服 务 器 进程 和 客户 端 进程 使 用 共享 内 存 传输 数据 ,只 需要 让 服务 器 进程 将 
数据 写 入 共享 内 存 , 客 户 端 进程 从 共享 内 存 中 读 出 数据 即 可 。 使 用 这 一 方式 通信 时 ,只 对 内 
存 写 一 次 `. 读 一 次 ,与 使 用 文件 或 管道 通信 的 方式 相 比 较 , 通 信 速 度 快 ,适合 传输 大 量 数据 。 


进程 P1 进程 P2 


代码 区 


代码 区 


图 7.1 共享 内 存 的 通信 原理 


由 于 共享 内 存 要 占用 大 量 的 内 存 空 间 , 因 此 系统 对 共享 内 存 的 大 小 做 了 限制 ,这些 关 
于 共享 内 存 的 信息 可 以 在 /usr/include/linux/shm. h 头 文件 中 查 到 ,如 下 所 示 。 


# define SHMMIN 1 /* min shared seg size (bytes) * / 
# define SHMWNI 4096 /* max num of segs system wide* / 
# define SIMAX (ULONG MAX - (IUL < < 24)) /* max shared seg size (bytes) * / 
# define SMALL (ULONG MAX - (IUL < < 24)) /* max shm system wide (pages) * / 
# define SHMSEG SHMMNI /* max shared segs per process * / 


每 个 共享 内 存 都 有 一 个 shmid ds 类 型 的 结构 与 之 对 应 ,这 个 结构 用 来 记录 共享 内 存 
的 一 些 属性 ,至 少 包括 以 下 的 几 个 属性 ,这 些 属性 是 关于 共享 内 存 使 用 权限 的 一 些 属性 。 


struct shmid ds 

{ 
uid t sm perm.uid; 
uid t shm perm.gid; 
mode t shm perm.moxde; 
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多 个 进程 使 用 共享 内 存 实现 进程 间 通 信 的 过 程 如 图 7. 2 所 示 。 多 个 进程 使 用 共享 内 
存 时 ,首先 要 由 某 一 个 进程 创建 共享 内 存 , 在 创建 共享 内 存 时 ,将 会 为 共享 内 存 赋予 权限 
用 以 控制 共享 内 存 可 以 被 哪些 进程 使 用 。 创 建 共享 内 存 之 后 ,通信 的 进程 就 可 以 将 共享 
内 存 连 接 到 自己 的 地 址 空间 中 ,使 用 各 种 对 内 存 操作 的 函数 或 系统 调用 来 使 用 共享 内 存 。 
当 通 信 结 束 后 ,使 用 共享 内 存 的 进程 要 将 共享 内 存 从 地 址 空间 中 剥离 出 来 ,并且 由 创建 共 
享 内 存 者 将 不 再 使 用 的 共享 内 存 删除 。 


创建 共享 内 存 -| 连接 共享 内 存 -| 使 用 共享 内 存 —- 解脱 共享 内 存 I4 删除 共享 内 存 


图 7.2 共享 内 存 的 使 用 过 程 


1. 创建 共享 内 存 一 一 shmget 
shmget 函数 用 来 创建 共享 内 存 , 函 数 接口 规范 说 明 如 表 7. 1 所 示 。 


表 7.1 shmget 函数 的 接口 规范 说 明 


函数 名 称 shmget 

函数 功能 创建 共享 内 存 

头 文件 # include<sys/shm. h> 

函数 原型 int shmget(key t key, size_t size» int shmflg? ; 
key; 用 于 创建 共享 内 存 的 键 值 

参数 size: 共享 内 存 的 大 小 ( 字 节 数 ) 
shmflg: 共享 内 存 的 权限 

20; 共享 内 存 的 ID 号 

-i me 


创建 共享 内 存 时 ,通常 将 参数 size 取 系 统 页 长 大 小 的 倍数 。 参 数 shmflg 用 于 设置 共 
享 内 存 的 使 用 权限 ,通常 shmflg 表示 为 IPC. xxx| mode 的 形式 。 其 中 mode 和 使 用 open 
函数 时 的 权限 设置 方法 相同 , 当 mode 为 0 时 表示 不 检查 权限 ,IPC_xxx 用 来 设置 IPC VE 
源 的 创建 方式 ,可 使 用 以 下 的 几 个 值 , 它 们 记录 在 头 文件 bits/ipc. h 中 。 


/* Mode bits for 'msgget', 'semget', and 'shmget' */ 


# define IPC CREAT 01000 /* Create key if key does not exist * / 
# define IPC EXCL 02000 /* Fail if key exists */ 
# define IPC NOWAIT 04000 /* Retum error n wait */ 


通常 ,共享 内 存 由 通信 进程 中 的 某 个 进程 创建 , 当 某 个 用 户 进程 创建 了 共享 内 存 , 那 
么 该 用 户 所 创建 的 其 他 进程 对 该 共享 内 存 都 有 写 人 的 权限 ,其 他 用 户 创 建 的 进程 只 能 对 
共享 内 存 做 读 操作 。 进 程 要 访问 已 有 的 共享 内 存 时 ,也 要 先 调用 shmget 函数 ,表示 需要 
引用 此 共享 内 存 。 引 用 共享 内 存 时 ,将 参数 size 设置 为 0。 

创建 了 共享 内 存 段 之 后 暂时 还 不 能 直接 使 用 它 ,需要 将 它 连 接 到 进程 的 地 址 空间 后 
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才能 使 用 。 
2. 连接 共享 内 存 shmat 
连接 共享 内 存 使 用 shmat 函数 ,其 函数 接口 规范 说 明 如 表 7. 2 所 示 。 


表 7.2 shmat 函数 的 接口 规范 说 明 


函数 名 称 shmat 

函数 功能 连接 共享 内 存 

头 文件 # include sys/shm. h> 

函数 原型 int shmat(int shmid, void * shmaddr, int flag) ; 
shmid: 共享 内 存 的 ID 号 

参数 shmaddr: 共享 内 存在 当前 进程 中 的 起 始 地 址 
flag: 访问 共享 内 存 的 方式 

i 20: 共享 内 存 的 起 始 地 址 

mala 一 1: 失败 


连接 共享 内 存 时 ,共享 内 存 被 加 入 到 进程 的 地 址 空间 中 ,成 为 地 址 空间 的 一 部 分 。 参 
数 shmaddr 用 来 说 明 如 何 设 定 共享 内 存在 进程 地 址 空间 中 的 起 始 地 址 , 它 可 以 被 设置 为 
以 下 几 个 取 值 : 

* shmaddr— —0; 表示 将 此 共享 内 存 段 连接 到 由 内 核 选 择 的 第 一 个 可 用 地 址 上 。 
这 种 方式 是 推荐 使 用 的 方式 ,通常 系统 内 核 比 程序 设计 人 员 更 了 解 进程 地 址 空间 
的 结构 和 硬件 结构 。 
shmaddrÆ0 并 且 flag 中 未 指定 SHM_RND 标识 : 表示 将 此 共享 内 存 段 连接 到 
shmaddr 所 指定 的 地 址 上 。 
shmaddr 取 0 并 且 flag 中 指定 了 SHM_RND 标识 : 表示 将 共享 内 存 段 连接 到 
shmaddr 向 下 取 到 的 最 近 的 一 个 SHMLBA 的 地 址 上 。SHM_RND 表示 地 址 取 
整 , 即 SHMLBA 取 “ 低 边界 地 址 的 整 倍数 ”。 

flag 用 来 控制 对 共享 内 存 的 访问 方式 ,如 果 指 定 了 SHM_RDONLY 位 ,表示 以 只 读 
的 方式 使 用 共享 内 存 段 。 若 未 设置 , 则 表示 以 读 写 的 方式 使 用 此 共享 内 存 段 。 

当 shmat 函数 调用 成 功 时 ,除了 会 返回 共享 内 存 的 实际 起 始 地 址 之 外 ,还 会 将 共享 
内 存 相应 的 shmid_ds 结构 中 的 shm_nattach 计数 器 值 加 1 。 

共享 内 存 连接 到 进程 的 地 址 空间 中 后 ,进程 可 以 像 使 用 自己 的 变量 一 样 通过 地 址 来 
使 用 共享 内 存 , 之 前 所 介绍 过 的 read write 等 函数 都 可 以 实现 对 共享 内 存 的 读 写 操作 。 

3. 解脱 共享 内 存 shmdt 

共享 内 存 使 用 完毕 后 ,要 从 进程 的 地 址 空间 中 解脱 出 来 才 可 以 删除 ,解脱 共享 内 存 使 
用 函数 shmdt, 函数 接口 规范 说 明 如 表 7. 3 所 示 。 


表 7.3 shmdt 函数 的 接口 规范 说 明 
函数 名 称 shmdt 
函数 功能 解脱 共享 内 存 


第 7 章 ， 进程 间 通 信 


续 表 
头 文件 # include sys/shm. h> 
函数 原型 int shmdt(void * shmaddr); 
参数 shmaddr: 共享 内 存 的 起 始 地 址 
1 0: 成 功 
M" 一 1: 失败 


shmdt 函数 中 使 用 的 参数 shmaddr 是 在 调用 shmat 函数 时 的 返回 值 ,是 共享 内 存在 
进程 地 址 空间 中 的 地 址 。shmdt 函数 除了 会 将 共享 内 存 从 进程 地 址 空间 中 解脱 出 来 ,还 
会 将 共享 内 存 所 对 应 的 shmid_ds 结构 中 的 shm_nattach 计数 器 值 减 1。 当 共 享 内 存 段 对 
应 的 shm_nattach 计数 器 值 为 0 时 ,可 将 该 共享 内 存 删 除 。 

4. 操作 共享 内 存 一 一 shmcetl 

shmetl 函数 常用 来 删除 指定 的 共享 内 存 , 除 此 之 外 ,shmetl 函数 还 可 以 对 共享 内 存 
执行 多 种 操作 ,其 函数 接口 规范 说 明 如 表 7.4 所 示 。 


表 7.4 shmetl 函数 的 接口 规范 说 明 


函数 名 称 shmcetl 

函数 功能 操作 共享 内 存 

头 文件 # include<sys/shm. h> 

函数 原型 int shmctlCint shmid, int cmd, struct shmid ds * buf); 
shmid: 共享 内 存 的 ID 号 

参数 cmd: 要 执行 的 操作 
buf; 根据 cmd 不 同 ,buf 有 不 同 的 含义 

0: 成 功 

iin 一 1: 失败 


在 shmetl 函数 中 ,参数 buf 的 含义 随 着 cmd 的 变化 有 所 不 同 ,参数 cmd 可 以 是 
表 7.5 中 的 某 一 种 操作 。 


表 7.5 shmetl 函数 中 cmd 的 取 值 范围 和 buf 的 含义 


cmd 操 作 buf 
IPC STAT 获取 共享 内 存 段 的 shmid_ds 结构 存放 shm_id 数据 的 结构 体 变 量 指针 
EEC 
IPC_RMID 从 系统 中 删除 共享 内 存 段 无 意义 
SHM LOCK 将 共享 内 存 段 锁定 在 内 存 中 无 意义 
SHM UNLOCK | 解锁 共享 内 存 段 无 意义 


从 表 7. 5 中 可 以 看 出 shmetl 函数 可 以 获取 或 设 定 共享 内 存 段 的 属性 ,或 删除 、 锁 定 
共享 内 存 。 本 章 使 用 的 操作 是 IPC_RMID 删除 共享 内 存 段 。 后 两 种 操作 只 有 Linux 和 
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Solaris 系统 支持 ,使 用 时 要 注意 运行 平台 是 否 能 支持 该 操作 。 
723 共享 内 存 实现 进程 间 通 信 


本 节 使 用 共享 内 存 实现 7. 1 节 中 服务 器 进程 与 客户 端 进程 通信 的 例子 。 服 务 器 进程 
创建 共享 内 存 , 设 定 相应 权限 允许 客户 端 进程 访问 共享 内 存 , 随 后 将 信息 写 人 共享 内 存 ， 
等 待 客户 端 读 出 。 当 共享 内 存 不 再 使 用 时 ,由 服务 器 进程 将 共享 内 存 删除 。 客 户 端 进程 
引用 共享 内 存 , 读 出 服务 器 所 写 的 数据 ,输出 在 标准 设备 上 ,随后 解脱 共享 内 存 。 

服务 器 程序 代码 如 示例 程序 7. 3-1 Bros ,客户 端 代码 如 示例 程序 7. 3-2 所 示 。 


[示例 程序 7.3- 1 omme shm server.c] 
f include< stdio.h> 

# includec stdlib.h> 

# include< sys/shm.h» 

# include< time.h> 

# include< string.h> 


# define SM KEY 99 // 设 定 创建 共享 内 存 的 键 值 


main() 
int seg id; 
char * mem ptr; 
time t now; 
int i,times- 8; 
long randata; 
char * message, temp[64] ; 


seg id- shmget (SHM KEY, 100, IPC_CREAT| 0777) ; 
if(seg id---1) 
t 
perror ("shmget") ; 
exit(EXIT FAILUFE) ; 
* 
mem ptr-shmat(seg id,NULL,O) ; 
if(mem ptr-- NULL) 
t 
perror ("strat") ; 
exit(EXIT FAILURE); 
$ 
while(times» 0) 
t 
srandam (time (&now) ) ; 
randata- randam() ; 
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i= G;temp[63]- '\0'; 
while (randata> 0) 
t 
temp[i- - ]- randata$10* 48; 
randata/- 10; 
) 
message- tempt i+ 1; 
stropy (mem ptr,message); 
sleep(1); 
times- 一 7 
) 
shmctl(seg id,IFC FMID,NULL); 
) 


在 服务 器 程序 中 ,使 用 宏 定 义 了 生成 共享 内 存 的 键 值 为 99 ,随后 创建 共享 内 存 , 大 小 
为 100 个 字 节 ,权限 为 所 有 人 都 可 读 可 写 可 执行 。 随 后 服务 器 进程 使 用 shmat 函数 连接 
共享 内 存 , 连 接 成 功 后 ,指针 mem_ptr 记录 了 共享 内 存 的 起 始 地 址 。 接 下 来 在 while (ff 
环 中 ,生成 随机 数 , 写 人 共享 内 存 中 ,总 共 写 人 8 个 随机 数 。 读 写 共享 内 存 的 操作 结束 后 ， 
调用 shmetl 函数 ,将 其 参数 cmd 设置 为 IPC. RMID. buf 设置 为 NULL ,删除 共享 内 存 。 


[示例 程序 7.3- 2 omm she client.c] 
# include< stdio.h> 

# include< stdlib.h> 

# include< sys/shm.h> 


#define SM KEY 99 // 定 义 引用 共享 内 存 的 键 值 


main() 

{ 
int seg id; 
char * mem ptr; 


if((seg id= shmget (SM KEY,00,0777))- — - 1) 
( 
Perror ("shmget"); 
exit); 
) 
mem ptr- shmat (seg id,NUIL,O) ; 
if (mem ptr-- NULL) 
( 
perror ("shat"); 
exit); 
) 
printf ("Ihe randam nmber is:$s\n",mem ptr); 
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simi (rem ptr); 
} 


在 客户 端 程序 中 ,将 整数 99 定义 为 引用 共享 内 存 的 键 值 ,调用 shmget 引用 服务 器 进 
程 创建 的 共享 内 存 ( 引 用 共享 内 存 时 , 设 定 的 键 值 必 须 与 创建 时 的 键 值 相等 才能 正确 引用 
到 已 创建 的 共享 内 存 )。 随 后 调用 shmat 连接 共享 内 存 , 当 连接 成 功 时 ,输出 指针 mem_ptr 
所 指 内 存 的 信息 。 最 后 ,解脱 共享 内 存 。 程 序 运行 情况 如 下 所 示 : 


rootGubuntu:* # goc comu- shw- server.c - o server 

rootQ$ubuntu:* # goc omw- shw client.c -o client 

root@ubuntu:~ # ./server& 

[1] 2954 

root@ubuntu:~ # ./client 

The randam number is:1242973753 

root@ubuntu:~ # ./client 

The randam number is:1697955767 

root@ubuntu:~ # ./client 

The randam number is:20855984 

root@ubuntu:~ # 

u+ 完成 ./server 

从 运行 结果 中 可 以 看 到 ,在 服务 器 程序 运行 期 间 , 客 户 端 程序 运行 了 三 次 ,因此 在 屏 
幕 上 输出 了 三 行 随机 数 。 

使 用 共享 内 存 实现 进程 间 通信 有 以 下 几 点 需要 注意 : 

CD 通信 进程 要 具有 使 用 共享 内 存 的 权限 。 共 享 内 存 和 文件 类 似 ,使 用 时 需要 进程 
具有 相应 的 权限 才 可 以 使 用 ,因此 服务 器 进程 在 创建 共享 内 存 时 要 设置 相应 的 组 用 户 权 
限 或 其 他 用 户 权限 ,保证 客户 端 进程 能 够 访问 共享 内 存 。 

(2) 多 个 客户 端 进程 可 以 同时 从 共享 内 存 段 中 读 取 数 据 。 当 多 个 客户 端 进程 需要 获 
取 随 机 数 时 ,每 个 具有 权限 的 客户 端 进程 都 可 以 将 共享 内 存 段 连接 到 自己 的 地 址 空间 中 ， 
因此 可 以 读 取 到 共享 内 存 中 的 数据 。 

(3) 当 客 户 端 进程 读 取 共享 内 存 中 的 数据 时 ,如 果 服 务 器 进程 正好 也 在 向 共享 内 存 
中 写 人 数据 ,那么 客户 端 进程 有 可 能 读 到 不 一 致 的 数据 。 因 此 读 、 写 操作 必须 互 斥 进行 ， 
这 需要 对 共享 内 存 辅 以 控制 手段 ,可 以 使 用 信号 量 来 对 共享 内 存 加 锁 , 保 证 客户 端 进 程 和 
服务 器 进程 互 斥 使 用 共享 内 存 。 


724 三 种 通信 方式 的 比较 


从 示例 程序 7. 3 可 以 看 到 ,共享 内 存 也 可 以 实现 在 服务 器 和 客户 端 进程 间 传送 数据 ， 
到 现在 为 止 ,已 经 实现 了 使 用 文件 ,管道 和 共享 内 存 实现 进程 间 通 信 , 这 三 种 方式 在 不 同 
的 方面 各 有 优 劣 。 

1. 访问 速度 

文件 : 服务 器 进程 将 数据 从 内 存 中 写 入 磁盘 ,客户 端 进程 从 磁盘 中 读 出 数据 。 

命名 管道 : 服务 器 进程 将 数据 写 人 命名 管道 时 ,需要 从 用 户 模式 切换 到 内 核 模式 , 客 
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户 端 进程 使 用 系统 调用 读 出 管道 中 的 数据 时 ,也 需要 由 内 核 模式 到 用 户 模式 的 转换 。 

共享 内 存 : 连接 共享 内 存 后 ,服务 器 进程 将 数据 写 人 共享 内 存 段 ,客户 端 进程 从 共享 
内 存 中 读 出 数据 。 

从 理论 上 来 看 ,使 用 共享 内 存 的 访问 速度 是 最 快 的 ,但 在 操作 系统 的 内 存 管理 机 制 
中 ,虚拟 内 存 系统 允许 用 户 空间 中 的 段 交换 到 磁盘 上 , 当 有 内 存 段 的 交换 发 生 时 ,访问 速 
度 会 有 明显 的 降低 ,所 以 使 用 共享 内 存在 实际 情况 下 不 一 定 是 最 快 的 。 但 总 体 来 看 ,只 访 
问 用 户 空间 的 速度 要 高 于 访问 时 在 内 核 空间 和 用 户 空间 切换 的 情况 ,而 需要 访问 磁盘 的 
方式 速度 是 最 慢 的 。 

2. 使 用 范围 

命名 管道 和 共享 内 存 只 能 实现 在 同一 台 主 机 上 的 进程 进行 通信 ,而 文件 经 过 传输 后 
可 以 实现 不 同 主机 中 进程 的 通信 。 

3. 通信 资源 的 使 用 权限 

三 种 方式 都 可 以 提供 标准 UNIX 文件 系统 的 权限 控制 ,可 以 保证 通信 数据 的 安全 。 

4. 通信 资源 的 竞争 

命名 管道 是 由 内 核 管理 的 缓冲 区 队列 ,因此 在 用 户 空 间 中 不 存在 多 进程 读 写 的 竞争 。 
共享 内 存 和 文件 方式 存在 着 读 、 写 进程 对 资源 的 竞争 ,为 了 保证 数据 的 正确 性 ,保持 互 斥 
的 使 用 竞争 资源 ,这 两 种 方式 需要 程序 设计 人 员 添加 文件 锁 或 者 使 用 信号 量 来 协调 读 、 写 
双方 的 操作 。 

通过 以 上 的 比较 能 够 看 到 各 种 通信 方式 都 有 自己 适用 的 场合 ,因此 在 Linux 系统 中 
保留 了 多 种 通信 方式 以 满足 不 同 条 件 下 进程 间 通 信 。 


7.3 信 号 量 


731 信号 量 及 相关 系统 调用 


使 用 共享 内 存 实 现 进程 间 通 信 时 ,由 于 读 、 写 进程 同时 使 用 共享 内 存 会 造成 冲突 ,必须 
辅 以 其 他 机 制 来 保证 读 、 写 进程 互 斥 地 使 用 共享 内 存 , 信 号 量 就 是 一 种 可 供 使 用 的 机 制 。 

信号 量 是 一 个 计数 器 , 它 可 以 被 系统 中 的 任何 有 权限 的 进程 所 访问 ,进程 间 可 以 使 用 
这 个 计数 器 来 协调 对 于 共享 内 存 和 其 他 资源 的 访问 。 

在 类 UNIX 操作 系统 的 内 核 中 每 个 信号 量 由 一 个 无 名 结构 来 实现 , 它 主要 包含 以 下 
成 员 : 


struct 

{ 
unsigned short sewal; // 信 号 量 的 值 
pid t senpid; // 最 后 一 次 操作 信号 量 的 进程 D5 
unsigned short — semcnt; // 等 待 信号 量 值 增 大 的 进程 数量 


unsigned short — semzcnt; // 等 待 信号 量 值 为 0 的 进程 数量 


Sez 
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可 以 使 用 semetl 函数 来 获取 或 者 设置 结构 中 的 各 成 员 值 。 

进程 访问 竞争 资源 的 那 部 分 代码 被 称 为 临界 区 ,被 访问 的 竞争 资源 称 为 临界 资源 。 
如 果 只 有 一 个 临界 资源 ,为 了 保证 多 个 进程 互 斥 地 使 用 它 ,任何 时 刻 最 多 只 能 有 一 个 进程 
进入 临界 区 执行 访问 临界 资源 的 代码 。 加 入 信号 量 进行 控制 之 后 ,将 信号 量 初 值 设 定 为 
临界 资源 的 数量 ,进程 访问 临界 资源 的 过 程 需 要 执行 以 下 几 步 操作 : 

COD 测试 与 该 临界 资源 对 应 的 信号 量 ; 

(2) 如 果 信 号 量 值 大 于 0, 则 表明 此 进程 可 以 访问 临界 资源 。 进 程 将 信号 量 值 减 1， 
随后 进入 临界 区 ,执行 访问 临界 资源 的 代码 ; 

(3) 如 果 信 号 量 值 不 大 于 0, 则 表明 临界 资源 正在 被 别 的 进程 使 用 。 阻 塞 当前 进程 ， 
直到 信号 量 值 为 正 数 ,唤醒 等 待 此 临界 资源 的 阻塞 进程 队列 的 队 首 进程 。 被 唤醒 的 队 首 
进程 , 转 去 执行 第 (1) 步 。 

当 进 程 不 再 使 用 临界 资源 ,退出 临界 区 时 ,将 信号 量 值 加 1, 如 果 有 阻塞 的 进程 正 等 
待 使 用 临界 资源 ,唤醒 排 在 阻塞 队列 队 首 的 进程 。 

以 上 的 操作 就 是 操作 系统 中 所 讲 的 PV 操作 ,PV 操作 必须 是 原子 操作 ,对 信号 量 的 
测试 和 修改 信号 量 值 的 操作 不 能 被 中 断 , 因 此 通常 信号 量 机 制 是 在 内 核 中 实现 的 。 
Linux 系统 中 ,信号 量 是 一 种 内 核 变量 ,即使 没有 进程 正在 使 用 信号 量 , 它 们 也 是 存在 于 
系统 之 中 的 。 

在 进程 中 使 用 信号 量 时 ,首先 使 用 semget 函数 获取 信号 量 集合 ;随后 使 用 semctl 也 
数 为 信号 量 赋 初 值 ;semop 函数 可 以 用 来 对 信号 量 执 行 PV 操作 ;信号 量 不 再 使 用 时 可 以 
调用 semctl 函数 删除 信号 量 集 合 。 以 下 讲解 这 些 函 数 的 使 用 方法 。 

1. 创建 信号 量 集合 semget 

当 进 程 要 使 用 信号 量 时 ,首先 要 创建 一 个 信号 量 集合 ,可 使 用 函数 semget, 其 接口 规 
范 说 明 如 表 7.6 所 示 。 


表 7.6 semget 函数 的 接口 规范 说 明 


函数 名 称 semget 

函数 功能 创建 信号 量 集合 

头 文件 # include<sys/sem. h> 

函数 原型 int semget(key t key, int nsems, int flag); 
key. 用 于 获取 信号 量 的 键 值 

参数 nsems: 集合 中 信号 量 的 个 数 
flag: 使 用 信号 量 集合 的 权限 

0: 信号 量 集 合 的 ID 号 

EHE 一 1: 失败 


使 用 semget 创建 信号 量 集合 时 .参数 nsems 用 来 指定 集合 中 信号 量 的 个 数 。 与 共 
享 内 存 相 类 似 , 这 里 创建 的 信号 量 集合 可 以 供 通信 双方 进程 使 用 ,通信 各 方 的 某 一 个 进程 
创建 了 信和 号 量 集合 之 后 ,其 他 进程 通过 引用 的 方式 来 使 用 该 信号 量 集 合 。 创 建 和 引用 都 
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使 用 semget 函数 ,创建 时 必须 指定 集合 中 信号 量 的 个 数 ,引用 时 将 nsems 指定 为 0。 参 
数 flag 的 使 用 方式 和 创建 共享 内 存 时 权限 的 指定 方式 相同 。 

2. 操作 信号 量 集合 semctl 

semctl 函数 用 于 对 信号 量 或 信号 量 集合 进行 操作 ,函数 接口 规范 说 明 如 表 7.7 所 示 。 


表 7.7  semctl 函数 的 接口 规范 说 明 


函数 名 称 semctl 

函数 功能 操作 信号 量 集合 

头 文件 #include<sys/sem. h> 

函数 原型 int semctlCint semid,int semnum. int cmd [ ,union semun arg]); 
semid: 信号 量 集 的 ID 号 

参数 semnum: 信号 量 编号 
cmd: 要 执行 的 操作 
arg: 根据 cmd 不 同 ,arg 有 不 同 的 含义 

非 一 1: cmd 不 同 , 含 义 不 同 

alka 一 1: 失败 


其 中 ,semnum 用 于 说 明 对 哪 一 个 信号 量 进行 操作 , 取 值 范围 从 0 到 集合 中 信号 量 个 
数 减 1; 第 四 个 参数 是 可 选 的 ,在 cmd 使 用 某 些 操作 时 ,arg 可 以 不 写 , 如 果 要 使 用 arg, AB 
么 其 类 型 union semun 在 有 些 系统 中 必须 自行 实现 , 且 类 型 定义 是 固定 的 ,其 定义 如 下 : 


union semun 

{ 
int val; 
struct smid ds  * buf; 
unsigned short * array; 


) 


从 定义 可 以 看 出 semun 是 一 个 共用 体 的 类 型 ,在 使 用 时 , 任 一 时 刻 只 有 一 个 成 员 的 
值 是 有 意义 的 。 

semctl 和 shmetl 类 似 ,参数 cmd 可 以 选择 表 7. 8 中 的 取 值 来 进行 操作 。 
表 7.8  semctl 函数 中 cmd 的 取 值 范围 和 arg 的 含义 


cmd 操 作 arg 
IPC STAT | 获取 信号 量 集合 的 semid ds 结构 arg. buf 所 指 结构 存放 取出 的 数据 
IPC_SET | 按 arg. buf 所 指 结构 中 的 数据 进行 设置 
IPC RMID | 从 系统 中 删除 信号 量 集合 不 用 
GETVAL | 返回 编号 为 semnum 的 信号 量 的 semval 值 | 不 用 
SETVAL | 设置 编号 为 semnum 的 信号 量 的 semval f | arg. val 记录 待 设置 的 值 
GETALL 取 集 合 中 所 有 信号 量 的 值 arg. array 指向 存放 所 有 信号 量 值 的 数组 
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cmd E 作 arg 
SETALL | 设置 集合 中 所 有 信号 量 的 值 arg. array 所 指数 组 存放 信号 量 值 
GETPID 返回 编号 为 semnum 的 信号 量 的 sempid 值 | 不 用 
GETNCNT | 返回 编号 为 semnum 的 信号 量 的 semncnt 值 | 不 用 
SETZCNT | 返回 编号 为 semnum 的 信号 量 的 semzcnt 值 | 不 用 


对 于 以 上 的 取 值 ,除了 GETALL 操作 之 外 ,使 用 其 他 所 有 的 GET 操作 调用 semetl 
成 功 时 都 返回 相应 的 值 , 其 他 命令 如 果 执 行 成 功 返 回 0。 

在 示例 程序 7.4 中 ,函数 init_sem 将 ID 号 为 semid 的 信号 量 集合 中 编号 为 semnum 
的 信号 量 初始 值 设 为 val。 函 数 首先 实现 了 union semun 类 型 ,随后 将 val 赋 给 变量 
initval, 通 过 调用 semctl 实现 给 信号 量 赋 初 值 。 


[示例 程序 7.4 init sem] 
init sem(int semid,int semu, int val) 
{ 


union semn 


int val; 
struct semid ds * buf; 
unsigned short * array; 
JHinitval; 
initval.val- val; 
if (semctl (semid, serum, SEIVAL, initval)-- - 1) 
f 
perror ("senct1") ; 
exit(EXIT FAILURE); 


) 


3. 信号 量 PV 操作 一 一 semop 
semop 函数 以 原子 操作 的 方式 自动 地 执行 一 系列 的 操作 ,可 以 通过 调用 这 个 函数 给 
竞争 资源 加 锁 或 解锁 ,或 者 实现 PV 操作 。semop 函数 的 接口 规范 说 明 如 表 7.9 所 示 。 


表 7.9 semop 函数 的 接口 规范 说 明 


函数 名 称 semop 

函数 功能 信号 量 PV 操作 

头 文件 # include<sys/sem. h> 

函数 原型 int semop(int semid. struct sembuf semarray[]，size_t nops) ; 
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E 
shmid: 信号 量 集 的 ID 号 
参数 semarray: 存放 操作 的 数组 
nops: 操作 的 步 数 
. 0: 成 功 
返回 什 —1 失败 


其 中 ,参数 nops 表示 这 一 系列 的 操作 有 几 步 ;参数 semarray 数组 用 来 存放 具体 的 操 
作 是 什么 , 它 的 每 一 个 数组 元 素 就 代表 一 步 操作 ,其 类 型 定义 如 下 : 


struct senbuf 

t 
unsigned short sem num; // 信 号 量 的 序号 
short sem cp) // 正 数 、0 或 负数 
short sem flg; //1FC NOWAIT,SEM UNDO 


) 


每 一 步 操作 都 要 设置 以 上 三 个 成 员 的 值 , 表 示 以 sem. flag 的 方式 对 第 sem. num 个 
信和 号 量 做 操作 sem_op。 上 有 具体 操作 由 sem_op 的 值 决定 , 它 可 以 取 正 数 、0 或 负数 。 不 同 值 
的 含义 和 对 应 的 操作 如 下 : 
220, 进程 释放 的 资源 数量 ,给 信号 量 值 加 上 sem. op 的 值 
资源 够 用 : 从 信号 量 值 中 减 去 sem_op 的 值 
指定 了 IPC_NOWAIT: 出 错 返回 
did Pe IPC. NOWAIT; 进程 挂 起 
信号 量 为 0: 立即 退回 
gap o [E IPC NOWAIT: 出 错 返回 


未 指定 IPC_NOWAIT: 进程 挂 起 

上 述 操作 中 进程 挂 起 后 ,可 因为 以 下 事件 被 唤醒 : 

CD 此 信号 量 值 有 变化 , 且 变 化 满足 进程 的 要 求 。 

(2) 此 信号 量 被 从 系统 中 删除 了 。 

CD 进程 响应 了 某 个 信和 号 ,从 信号 处 理 程序 中 返回 。 

sem_flg 可 被 设置 为 IPC_NOWAIT、SEM_UNDO。 设 定 为 前 者 表示 当 信 号 量 不 满 
足 进 程 的 要 求 , 导 致 进程 需要 挂 起 时 ,不 挂 起 进程 ,直接 返回 错误 。 设 定 为 后 者 表示 ,由 内 
核 记 录 本 次 操作 对 信号 量 的 调整 。 这 样 做 的 目的 是 当 进 程 调用 exit 函数 退出 时 ,内 核 会 
根据 记录 的 调整 量 对 信号 量 做 出 修改 。 

示例 程序 7.5 是 使 用 semop 函数 实现 对 共享 资源 加 锁 的 函数 示例 。 

[示例 程序 7.5 lockforwrite] 

lockforwrite (int semid) 

{ 


<o: 进程 要 申请 的 资源 数量 | 


sem op 


—0, 进程 希望 等 待 到 该 信号 量 值 变 成 of 


struct serbuf action[2]; 
action[0].sem num-0; 
action[0].sem flg-SEM UNDO; 
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action[0].sem op=0; 
action[1] .sem num-1; 
action[1] .sem flg-SEM UNDO; 
action[1] .sem op=+1; 
if (semop (semid,action,2)==—1) 
{ 
perror ("semop"); 
exit(EXIT FAITURE); 


} 


示例 程序 7. 5 中 ,由 于 对 竞争 资源 的 读 、 写 操作 是 冲突 的 ,因此 需要 使 用 信号 量 来 协 
调 读 、 写 操作 。 其 中 0 号 信号 量 表示 给 共享 内 存 加 读 锁 ,1 号 信号 量 表示 给 共享 内 存 加 写 
锁 。 在 为 写 操作 而 锁定 竞争 资源 时 ,其 操作 过 程 为 : 
(1) 在 action 数组 中 设置 第 一 步 操作 : 检查 0 号 信号 量 的 值 是 否 为 0, 确 保 没 有 读 进 
程 在 使 用 竞争 资源 , 当 0 号 信号 量 值 为 0 时 ,继续 下 一 步 。 
(2) 在 action 数组 中 设置 第 二 步 操作 : 将 1 号 信号 量 值 加 1, 表 明 写 进程 要 使 用 竞争 
资源 。 
(3) 调用 semop 函数 ,执行 action 中 定义 的 操作 。 
执行 以 上 操作 时 ,如 果 0 号 信号 量 值 不 为 0, 则 挂 起 当前 进程 ,直到 0 号 信号 量 的 值 
为 0 再 给 竞争 资源 加 上 写 锁 。 
当 竞 争 资源 访问 结束 后 ,可 以 使 用 示例 程序 7. 6 释放 竞争 资源 上 的 写 锁 。 在 这 个 函 
数 中 只 设置 了 一 步 操作 ,即将 1 号 信号 量 的 值 减 1 ,表示 一 个 写 进程 不 再 使 用 竞争 资源 。 
[示例 程序 7.6 unlockafterwrite] 
unlockafterwrite (int semid) 
t 
struct senbuf action[1]; 
action[0].sem num- 1; 
action[0].sem flg- SEM UNDO; 
action[0].sem cp-- 1; 
if (semcp (semid, action, 1)- — - 1) 
t 
perror ("semp"); 
exit(EXIT FAILURE); 


) 


732 使 用 信号 量 控制 对 共享 内 存 的 访问 


本 节 使 用 信号 量 来 控制 共享 内 存 互 斥 地 被 读 、 写 进程 使 用 。 仍 然 使 用 服务 器 /客户 端 
模式 的 程序 作为 示例 : 服务 器 端 进程 向 共享 内 存 写 入 数据 ,客户 端 进程 从 共享 内 存 中 读 
出 数据 。 在 7. 2. 3 节 程 序 的 基础 上 增设 两 个 信号 量 ,0 号 信号 量 表示 对 共享 内 存 做 读 操 
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作 的 进程 数 ,1 号 信号 量 表示 对 共享 内 存 做 写 操作 的 进程 数 。 其 代码 见 示例 程序 7.7。 其 
中 示例 程序 7. 7-1 为 服务 器 代码 ,示例 程序 7. 7-2 为 客户 端 代码 。 


[示例 程序 7.7-1 om- ser server.c] 
# include< stdio.h> 

# include< stdlib.h> 

# include< sys/stm.h» 

# include< sys/sem.h» 

# include< time.h> 

# include< string.h> 

# include< sys/types.h» 


# define SM KEY 99 // 创 建 共享 内 存 的 键 值 
# define SEM KEY 111 // 创 建 信号 量 的 键 值 
union semn /实现 union semm 类 型 
{ 

int val; 


struct semid ds * buf; 
unsigned short * array; 
int seg id,semid; 


init sem(int semid, int semun, int val) // 信 号 量 值 初始 化 
{ 
union semn initval.val; 
initval.val- val; 
if(semctl (semid, samum, SEIVAL, initval)-- - 1) // 设 置信 号 量 初 值 
( 
perror ("semct1") ; 
exit (EXIT_FATIUFE) ; 


int get semval(int semid, int semnum) // 获 取信 号 量 值 
{ 
int val; 
if((val- semctl (semid, semm, GETVAL) )- — - 1) 
t 
perror ("semct1") ; 
exit(EXIT FAILURE); 
ti 
retum val; 
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lockforwrite (int semid) 


{ 


struct senbuf action[2]; 
action[0].sem num-0; 
action[0].sem flg-SEM UNDO; 
action[0].sem op= 0; 
action[l].sem nme 1; 
action[1].sem flg- SEM UNDO; 
action[l].sem op=+1; 
if (semop (semid, action,2)- - - 1) 
t 
perror ("semp") ; 
exit(EXIT FAILURE) ; 


unlockafterwrite (int semid) 


{ 


struct sembuf action[1]; 
action[0].sem num= 1; 
action[0].sem flg-SEM UNDO; 
action[0].sem cp= 一 17 
if (semop (semid, action,1)- - - 1) 
f 
perror ("semp") ; 
exit(EXIT FAILURE) ; 


main() 


char * mem ptr; 

time t now; 

int i,times- 8; 

long randata; 

char * message, tem[64] ; 


seg id-stmget (SEM KEY, 100,IPC CFEAT| 0777); 
if(seg id---1) 
{ 
perror ("shmget") ; 
exit(EXIT FAILURE); 
} 
mem ptr= shmat (seg_id, NULL, 0); 


// 写 共享 内 存 前 加 锁 


// 写 共享 内 存 后 解锁 


// 创 建 共享 内 存 


// 连 接 共享 内 存 


Samid semget(SEM KEY, 2, IEC CREAT| IPC EXCL| 0666); 


if(semid==—1) 
t 
perror ("semget") ; 
exit(EXIT FAILURE); 
) 
init sem(semid,0,0) ; 
init sem(semid,1,0); 


while (i> 0) 
t 
Srandam (time (&now) ) ; 
randata- randam(); 
i= €;temp[63]- 'N0'; 
while (randata» 0) 
t 
temp[i- - ]= randatat10* 48; 
randata/- 10; 
) 
message- temp i+ 1; 
printf ("Lock for write now ..An"); 
lockforwrite (semid); 
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// 创 建 信号 量 集 


// 初 始 化 0 号 信号 量 值 为 0 
// 初 始 化 1 号 信号 量 值 为 0 


// 生 成 随机 数 


// 将 随机 数 转换 为 字符 型 


/| 共享 内 存 加 写 锁 


printf ("sem value of read- %d, sem value of write=%d\n", 
get semval(semid,0),get semval (semid,1)); 


stropy (mem ptr,message) ; 
sleep(1); 
unlockafterwrite (semid) ; 
printf ("Unlock nown") ; 


i--; 


// 将 随机 数 写 人 共享 内 存 


// 解 开 写 锁 


printf ("sem value of read- %d, sem value of write= $dWnWn", 
get semval(semid,0),get semval (semid,1)); 


) 

shmctl(seg id,IPC FMID,NULL); 

sect] (semid, 0, IPC FMID,NULL) ; 
} 


// 删 除 共享 内 存 
// 删 除 信号 量 


示例 程序 7. 7-1 中 ,服务 器 进程 创建 共享 内 存 及 信号 量 集合 ,并 且 将 共享 内 存 连接 人 
自己 的 地 址 空间 ,将 两 个 信号 量 的 初 值 都 赋 为 0, 表 示 当 前 没有 读 进 程 或 写 进程 操作 共享 
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内 存 。 随 后 服务 器 进程 生成 随机 数 , 写 人 共享 内 存 前 ,调用 lockforwrite 函数 为 写 操作 锁 
定 共享 内 存 。 该 函数 首先 检查 是 否 有 读 进程 正在 读 共享 内 存 , 即 等 待 0 号 信号 量 为 0 时 
才能 继续 执行 后 续 代 码 。 当 没有 读 进程 读 共 享 内 存 时 ,将 1 号 信号 量 值 加 1, 表 示 有 一 个 
写 进 程 在 写 共享 进程 。 写 共享 内 存 操作 结束 后 ,将 1 号 信号 量 减 1, 表 示 一 个 写 进程 结束 
了 对 共享 内 存 的 操作 。 最 后 删除 共享 内 存 和 信号 量 集合 。 为 了 方便 查看 服务 器 进程 和 客 
户 端 进程 对 两 个 信号 量 值 的 修改 过 程 ,程序 在 修改 信号 量 值 后 获取 并 输出 了 两 个 信号 量 
的 值 。 
示例 程序 7. 7-2 为 客户 端 代码 。 


[示例 程序 7.7-2 omm sar client.c] 
# includec stdio.h» 

# includec stdlib.h> 

# includec sys/shm.h> 

# include< sys/sem.h» 

# include string.h> 

# includec sys/types.h» 


# define SHM KEY 99 
# define SEM KEY 111 


int get sem(int semid,int semnum) 
t 
int val; 
if((val- semct1 (semid, semnum, GEIVAL) )- — - 1) 
t 
perror ("semct1") ; 
exit(EXIT FAILURE); 
i 
retum val; 
) 


lockforread(int semid) 

{ 
struct serbuf action[2]; 
action[0].sem num-1; 
action[0].sem flg-SEM UNDO; 
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action[0].sem op-0; 
action[1].sem num-0; 
action[l].sem flg-SEM UNDO; 
action[1].sem op-- 1; 
证 (semop (semid,action,2)-— - 1) 
t 
perror ("semp") ; 
exit(EXIT FAIIDRE) ; 


unlockafterread(int semid) 
1 
struct senbuf action[1]; 
action[0].sem num- 0; 
action[0].sem flg-SEM UNDO; 
action[0].sem cp- - 1; 
if (semop (semid, action,1)- - - 1) 
t 
perror ("semp") ; 
Exit EXIT FAILUFE) ; 


main() 


int seg id,semid; 
char * mem ptr; 


seg id- shmget (SHM KEY,100,0777) ; // 引 用 共享 内 存 
if(seg id---1) 
t 
perror ("shmget") ; 
exit(); 
) 
mem ptr-shmat(seg id,NULL,O) ; // 连 接 共享 内 存 


if (mem ptr-- NULL) 

( 
perror ("smat"); 
exit(); 


semid- semet (SEM KEY,2,0) ; // 引 用 信号 量 集合 


`w Lnx 环 境 高 级 程序 设计 


if(semid==-1) 
{ 
perror ("senget") ; 
exit (1); 
} 
lockforread(semid) ; /共享 内 存 加 读 锁 
printf ("read value- &d, write value- $dWn", get. sem(semid,0), 
get sem(semid,1)) ; 
printf ("Ihe number is:$s\n",mem ptr); // 读 共享 内 存 
unlockafterread (semid); // 解 开 读 锁 
printf ("read value- &d, write value- $dn", get. sem(semid, 0) , 
get sem(semid,1)); 
simt (mem ptr); // 解 脱 共 享 内 存 


) 


在 示例 程序 7. 7-2 中 ,客户 端 进程 通过 相同 的 键 值 , 引 用 了 服务 器 进程 创建 的 共享 内 
存 和 信和 号 量 集合 。 随 后 测试 1 号 信号 量 是 否 为 0, 查 看 是 否 有 写 进程 在 操作 共享 内 存 。 
如 果 共 享 内 存 可 为 客户 端 进程 所 用 , 则 修改 0 号 信号 量 , 将 其 值 加 1, 表 示 多 了 一 个 客户 
端 进程 读 共 享 内 存 , 读 取 并 输出 数据 后 ,将 0 号 信号 量 值 减 1, 表 示 读 进程 不 再 使 用 共享 
内 存 。 最 后 客户 端 进程 解脱 共享 内 存 , 程 序 结束 。 

分 别 在 两 个 终端 中 执行 服务 器 和 客户 端 进程 。 按 照 程序 设 定 ,服务 器 进程 每 次 产生 
8 个 随机 数 ,以 覆盖 的 方式 写 和 人 共享 内 存 。 客 户 端 进程 每 次 运行 时 读 出 当时 保存 在 共享 
内 存 中 的 随机 数 。 从 两 个 信号 量 的 值 可 以 看 到 读 、 写 进程 交互 运行 的 情况 。 以 下 是 服务 
器 进程 的 运行 结果 ,其 中 以 注释 的 方式 标注 出 了 客户 端 进程 运行 的 时 间 。 


rootGubuntu:^ # ./sem- server 

lock for write now ... 

sem value of read- 0, sem value of write- 1 
Unlock now 

sem value of read- 0, sem value of write- 0 


Lock for write now ... 

sem value of read- 0, sem value of write- 1 
Unlock now 

sem value of read 0, sem value of write- 0 


Lock for write now ... 
sen value of read-0,sem value of write-1 

Unlock now 

sem value of read- 1,5em value of write- 0 // 读 端正 在 读 取 


Lock for write now ... 
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sem value of read- 0, sem value of write- 1 
Unlock now 
sem value of read- 0, sem value of write- 0 


Lock for write now ... 

sem value of read- 0, sem value of write- 1 

Unlock now 

sem value of read 1,5em value of write- 0 // 读 端正 在 读 取 


Lock for write now … 

sem value of read- 0, sem value of write=1 
Unlock now 

sem value of read- 0, sem value of write- 0 


Lock for write now … 

sem value of read 0, sem value of write- 1 
Unlock now 

sem value of read- 0, sem value of write- 0 


sem value of read- 0, sem value of write- 1 
Unlock now 
sem value of read- 0, sem value of write- 0 


另 一 个 终端 中 显示 的 客户 端 进程 运行 结果 如 下 : 


root@ubuntu:~ # ./sem- client 
read value= l,write value- 0 
The number is:940498544 

read value= 0,write value- 1 
root&ubuntu:^ # ./sem- client 
read value- l,write value- 0 
The number is:24220052 

read value- 0,write value- 1 


从 这 个 例子 中 可 以 看 到 ,使 用 信号 量 可 以 协调 有 冲突 的 进程 互 斥 地 使 用 竞争 资源 ,本 
例 将 读 、 写 锁 加 在 共享 内 存 这 一 竞争 资源 上 ,而 之 前 介绍 过 的 使 用 文件 实现 进程 间 通信 的 
示例 ,也 可 以 使 用 信号 量 对 其 进行 改造 ,控制 读 、 写 进程 互 斥 地 使 用 文件 。 
733 信号 量 机 制 总 结 

从 示例 程序 7.7 可 以 看 出 ,信号 量 是 一 种 进程 间 通信 的 机 制 ,通常 它 不 能 直接 传送 信 
息 ,大 多 用 来 作为 其 他 通信 机 制 的 辅助 手段 。 当 信和 号 量 用 于 多 进程 对 竞争 资源 的 访问 时 ， 


可 将 它 看 成 是 一 个 计数 器 。 一 般 而 言 ,信号 量 的 初 值 可 以 是 任 一 正 值 ,此 值 用 来 说 明 可 用 
的 共享 资源 数量 。 在 信和 号 量 的 控制 下 ,为 了 获取 共享 资源 ,进程 需要 做 以 下 操作 : 
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CD 测试 控制 共享 资源 的 信号 量 。 

(2) 若 信号 量 的 值 大 于 进程 要 求 的 资源 数量 ,表示 进程 可 使 用 该 资源 ;进程 将 信号 量 
值 减 掉 申 请 的 资源 数 。 

(3) 若 信 号 量 的 值 小 于 进程 要 求 的 该 资源 数 , 则 进程 进入 阻塞 状态 ,直到 信号 量 值 大 
于 申请 资源 数 时 ,进程 被 唤醒 , 转 去 执行 第 (1) 步 。 

当 进 程 释放 共享 资源 时 ,要 给 该 信号 量 值 加 上 释放 的 资源 数量 。 如 果 有 进程 正在 阻 
塞 等 待 此 信号 量 , 则 唤醒 它们 。 

Linux 系统 中 的 信号 量 机 制 和 操作 系统 原理 中 所 讲 的 信号 量 非常 类 似 , 其 相同 点 表 
现在 以 下 几 个 方面 : 

CD 信号 量 这 种 通信 机 制 是 为 了 协调 多 个 进程 对 竞争 资源 的 使 用 。 

(2) 信号 量 机 制 中 的 semop 操作 对 应 于 操作 系统 原理 中 的 PV 操作 。 

(3) 为 了 确保 对 信号 量 的 测试 及 加 减 操作 是 原子 操作 ,信号 量 机 制 是 在 内 核 中 实 
现 的 。 

除了 相同 点 之 外 ,它们 之 间 也 存在 着 一 些 不 同 , 主 要 表现 在 以 下 几 个 方面 : 

(1) 在 Linux 系统 中 ,信号 量 机 制 的 最 小 单位 是 信号 量 集合 ,并 非 单个 整数 值 ,信号 
量 集 合 中 的 信号 量 数目 在 创建 该 集合 时 指定 。 

(2) 在 Linux 系统 中 ,创建 信号 量 集合 与 对 信号 量 赋 初 值 这 两 个 操作 是 分 开 的 ,并 非 
是 合 在 一 起 的 原子 操作 。 这 是 Linux 系统 信号 量 机制 的 致命 缺点 : 当 进程 修改 信号 量 值 
的 时 刻 正好 介 于 创建 了 信号 量 集合 但 尚未 给 信号 量 赋 初 值 时 ,进程 无 法 获得 正确 的 信号 
量 值 。 

(3) 有 些 程序 在 终止 时 并 没有 释放 已 经 分 配给 它 的 信号 量 集合 ,在 调用 semop 操作 
时 设置 SEM_UNDO 标识 ,可 由 内 核 来 维护 信号 量 的 值 。 


7.4 System V IPC 


741 Linx 中 的 进程 通信 机 制 

实现 进程 间 通 信 (Inter-Processes Communication, IPC) 是 设计 多 进程 程序 时 需要 考 
虑 的 一 个 问题 。 进 程 通信 的 目的 有 很 多 ,有 可 能 是 为 了 传输 数据 ,也 可 能 是 为 了 多 进程 同 
步 , 或 者 是 某 个 进程 向 其 他 进程 发 送 控制 信息 等 。 目 前 为 止 ,我 们 已 经 学 习 了 多 种 在 
Linux 系统 中 实现 进程 间 通信 的 机 制 ,如 图 7. 3 中 所 示 。 


AT&T 


SYSTEM V IPC | | 


最 初 的 UNIX IPC BS 


(管道 、 信号 、 文件 ) 基于 Socket IPC 上 一 一 一 | Linux IPC 


Posix IPC {— 


图 7.3 Linux 系统 的 进程 间 通 信 机 制 
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从 图 7. 3 中 能 看 出 ,Linux 操作 系统 大 部 分 的 进程 间 通 信 机 制 都 是 从 UNIX 继承 而 来 
的 ,Linux 的 通信 机 制 包括 管道 和 信号 这 类 传统 的 通信 机 制 ;广义 来 说 ,文件 也 可 以 看 作 一 
种 进程 间 的 通信 和 机制 ;消息 队列 ,共享 内 存 和 信号 量 被 称 为 System V IPC 通信 和 机制 ,它们 是 
贝尔 实验 室 对 UNIX 早期 的 进程 间 通 信和 方法 进行 改进 和 扩充 得 到 的 通信 机 制 ;POSIX IPC 
也 包括 消息 队列 、 共 享 内 存 和 信号 量 ; 套 接 字 也 是 Linux 进程 间 通 信 机 制 的 一 种 , 它 是 由 加 
州 伯克利 大 学 在 UNIX 通信 机 制 基础 上 改进 的 ,可 用 于 网 络 通 信 。 以 上 这 些 不 同 的 通信 方 
式 适用 的 场合 也 有 所 不 同 , 不 同 的 场合 可 以 使 用 的 通信 机 制 也 不 同 ,如 图 7.4 所 示 。 


无 名 管道 
UNIX 进 程 通信 方式 | 有 名 管道 
信号 
同一 主机 
进 信号 量 
System V 进 程 通信 方式 | 消息 队列 
通 共享 内 存 
文件 
不 同 主机 | 
套 接 字 


图 7.4 不 同 场合 下 适用 的 进程 间 通 信 机 制 


从 图 7.4 中 可 以 看 到 当 不 同 主机 要 实现 进程 通信 时 ,可 以 选用 文件 作为 传输 工具 或 
者 通过 套 接 字 连接 通信 的 进程 。 在 同一 主机 内 ,可 以 使 用 匿名 管道 .命名 管道 信号、 信和 号 
量 ` 消 息 队列 以 及 共享 内 存 来 进行 通信 。 前 面 的 章节 已 经 详细 介绍 了 使 用 匿名 管道 .命名 
管道 和 信号 实现 通信 的 方法 。 本 章 重 点 介绍 System V 的 三 种 通信 机 制 , 套 接 字 这 一 通 
信和 机制 将 放 在 第 10 章 进行 介绍 。 


742 SysemV IPC 概 述 


System V IPC 分 为 消息 队列 .共享 内 存 和 信号 量 三 种 机 制 , 从 功能 .作用 和 适用 场合 
来 看 ,它们 各 有 不 同 。 

消息 队列 是 一 个 消息 的 链 式 队列 ,在 这 一 方式 中 ,通信 双方 通过 读 写 消息 来 实现 通 
信 : 有 足够 权限 的 进程 可 以 向 消息 队列 中 添加 消息 ,具有 读 权限 的 进程 可 以 读 取 队 列 中 
的 消息 。 

共享 内 存 是 多 个 进程 可 以 访问 的 同一 块 内 存 空间 ,从 理论 上 来 说 是 最 快 的 一 种 IPC 
机 制 ,适合 传输 大 量 的 数据 。 使 用 共享 内 存 时 .通常 要 与 其 他 通信 机 制 结合 使 用 ,才能 保 
证 多 个 进程 访问 共享 内 存 时 的 同步 互 斥 问题 。 

信号 量 主要 用 作 进 程 间 以 及 同一 进程 的 不 同 线程 之 间 通 信 时 的 同步 手段 。 

以 上 三 种 通信 机 制 都 是 用 于 同一 主机 的 进程 间 进 行 信息 的 传输 或 同步 。 在 Shell 环 
境 中 ,使 用 ipcs 命令 可 以 显示 当前 系统 中 这 三 种 IPC 资源 的 情况 ,如 图 7.5 所 示 。 

从 图 7. 5 中 可 以 看 到 ,三 种 IPC 机 制 按照 类 别 显 示 ,每 个 IPC 资源 都 包含 有 键 值 ID 
值 \ 属 主 \ 权 限 和 大 小 等 属性 。 在 Shell 环境 下 ,使 用 ipemk 命令 可 以 创建 IPC 资源 ,使 用 
ipcrm 命令 可 以 删除 IPC 资源 。 
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x90000000 13434: 
9000 1376264 


图 7.5 System V IPC 资源 


743 IPC 的 标识 符 和 键 


正如 在 示例 程序 7.7 中 看 到 的 ,System V IPC 资源 在 使 用 前 首先 需要 创建 , 当 IPC 
对 象 被 创建 以 后 ,所 有 对 该 IPC 对 象 的 操作 ,都 需要 通过 它 的 ID 号 来 进行 。 而 进程 间 通 
信 至 少 涉及 两 个 进程 ,只 有 其 中 一 方 可 以 创建 IPC 对 象 , 另 一 方 只 能 对 IPC 对 象 进行 引 
用 ,这 时 就 需要 通过 某 种 办 法 ,保证 通信 的 多 个 进程 访问 的 是 同一 个 IPC 对 象 。 
消息 队列 .共享 内 存 和 信和 号 量 三 种 IPC 在 创建 和 引用 时 流程 都 是 相同 的 ,具体 过 程 
为 : 创建 IPC 资源 时 ,约定 一 个 键 值 ; 各 自 调用 get(msgget、shmget 和 semgeo PR Zi 8) d 
或 引用 IPC 对 象 ,随后 返回 其 ID 值 ,ID 值 是 一 个 非 负 整数 , 它 是 IPC 对 象 的 内 部 名 ;由 于 
调用 get 函数 时 使 用 相同 的 键 值 将 得 到 相同 的 ID 值 ,所 以 每 个 IPC 对 象 都 与 一 个 ID fi 
相关 联 , 使 用 同一 个 键 值 可 以 确保 通信 的 各 个 进程 访问 的 是 同一 个 IPC 对 象 。 因 此 可 以 
将 键 用 来 作为 IPC 对 象 的 外 部 名 

在 本 节 所 要 实现 的 服务 器 /客户 端 模式 的 多 进程 程序 中 ,可 以 使 用 以 下 方法 使 多 个 有 
合作 关系 的 进程 在 同一 IPC 上 会 合 

CD 服务 器 进程 可 以 指定 使 用 宏 IPC PRIVATE 创建 一 个 新 的 IPC 对 象 ,可 以 将 此 
ID 值 保存 在 文件 或 其 他 载体 中 ,以 供 客户 端 进程 使 用 。 这 种 方法 的 缺点 是 服务 器 进程 要 
将 ID 值 写 人 文件 中 ,客户 端 进程 要 从 文件 中 读 出 ID 值 ,又 会 出 现 进程 对 竞争 资源 的 访 
问 。 对 于 有 亲缘 关系 的 进程 来 说 ,可 以 不 使 用 文件 保存 IPC 的 ID 值 。 父 进程 使 用 IPC_ 
PRIVATE 创建 IPC 对 象 后 ,获得 的 ID 值 在 调用 fork 后 可 以 被 子 进程 使 用 , 子 进 程 也 可 
以 将 这 个 ID 值 作为 参数 调用 eXec 族 函 数 传 给 新 的 程序 。 

(2) 可 以 在 某 个 公用 的 头 文件 中 记录 用 于 创建 IPC 对 象 的 键 。 服 务 器 进程 使 用 此 键 
创建 一 个 新 的 IPC 对 象 ,客户 端 进程 使 用 此 键 引 用 对 应 的 IPC 对 象 。 在 这 种 方法 中 ,由 
于 该 键 是 一 个 固定 值 , 有 可 能 创建 时 与 该 键 对 应 的 IPC 对 象 已 经 存在 了 ,这 时 服务 器 进 
程 创建 IPC 对 象 就 会 出 错 ,必须 先 删除 原 有 的 IPC 对 象 才能 再 创建 。 

(3) 合作 的 多 方 进程 认同 同一 个 路 径 名 和 项 目 ID(0 一 255 的 字符 值 ) ,调用 ftok 函数 
将 这 两 个 值 转换 为 一 个 键 值 ,随后 使 用 该 键 创 建 IPC 对 象 。ftok 函数 的 作用 就 是 将 路 径 
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名 和 项 目 值 转换 成 一 个 键 值 ,其 函数 接口 规范 说 明 如 表 7. 10 所 示 。 
表 7.10 ftok 函数 的 接口 规范 说 明 


函数 名 称 ftok 

函数 功能 根据 路 径 名 和 项 目 ID 生成 键 

头 文件 # include<sys/ipc. h> 

函数 原型 key t ftokCchar * path, int id); 
path. 路 径 名 

id: WE ID 

" >—1: 成 功 

—-— -i 失败 


K 7. 10 中 所 列 出 的 函数 类 型 key_t 是 一 种 基本 系统 数据 类 型 ,通常 在 头 文件 sys/ 
types. h 中 定义 为 长 整 型 。 参 数 path 必须 是 一 个 已 经 存在 的 文件 。 

此 方法 也 存在 着 缺点 ,根据 ftok 函数 生成 键 的 规则 , 当 使 用 不 同 的 路 径 名 、 相 同 的 项 
目 ID 时 ,有 可 能 生成 相同 的 键 值 。 

以 上 三 种 方式 都 可 以 保证 通信 的 多 个 进程 获得 相同 的 IPC 对 象 ID 值 ,不 管 使 用 的 
是 哪 种 方法 ,都 可 以 调用 get 函数 通过 键 值 和 标志 值 创 建 相应 的 IPC 对 象 。 为 了 保证 成 
功 创建 对 象 ,至 少 需要 满足 以 下 两 个 条 件 中 的 一 个 : 

(1) 键 值 是 IPC_PRIVATE。 

(2) 键 值 当前 未 与 某 一 个 已 经 存在 的 IPC 对 象 关联 ,并 且 标 志 值 中 指定 了 IPC_ 
CREAT fù. 

对 于 客户 端 进程 , 当 需 要 访问 IPC 对 象 时 ,可 以 使 用 get 函数 来 获得 IPC 对 象 的 ID 
值 。 此 时 ,get 函数 所 使 用 的 键 值 必须 与 创建 时 的 键 值 相 同 ,并 且 不 能 在 标志 值 中 指定 
IPC_PRIVATE。 

由 于 宏 IPC. PRIVATE 是 一 个 特殊 的 键 值 ,在 每 次 引用 后 其 值 将 会 有 所 变化 ,因此 
访问 已 有 的 IPC 对 象 时 ,不 能 通过 指定 键 值 为 IPC. PRIVATE 这 一 方法 来 实现 。 使 用 
IPC_PRIVATE 创建 的 IPC 对 象 可 以 在 有 亲缘 关系 的 进程 间 使 用 ,或 通过 其 他 方法 获知 
创建 对 象 时 的 值 ,再 使 用 此 值 来 访问 IPC 对 象 。 


7.5 消息 队列 


751 消息 队列 的 概念 


消息 队列 是 进程 间 通 信 的 一 种 机 制 , 它 是 存放 在 内 核 空 间 中 的 消息 的 链 式 队列 ,默认 
情况 下 ,整个 系统 中 最 多 允许 有 16 个 消息 队列 同时 存在 。 消 息 队 列 的 示意 图 如 图 7. 6 
所 示 。 

从 图 中 可 以 看 出 消息 队列 的 结构 与 数据 结构 中 链 队 列 的 结构 类 似 ,使 用 消息 队列 时 
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msqid_ds 结 构 
em 权限 CN LNA Y 
消 | 消 消 | 消 | 下 || 消 | 消 | 消 | 下 消 | 消 | 消 | 下 
msg fist |———-| BB BiR|-|R|RISRI— 县 | 县 | 息 | 一 
类 | 大 大 | 位 | 消 上 类 | 大 | 位 | 消 类 | 大 | 位 | 消 
msg last 型 | 小 小 | 置 | 息 | 上 | 型 | 小 | 置 | 撩 型 | 小 | 置 | 息 
: msg p 2 msl msg 
其 他 信息 消息 消息 消息 | [me 全- 


图 7.6 消息 队列 的 示意 图 


也 符合 先进 先 出 (FIFO) 原 则 。 由 于 消息 队列 在 进行 操作 时 可 以 基于 类 型 ,因此 FIFO 原 
则 只 适用 于 同类 型 的 消息 。 

图 7.6 中 的 msqid_ds 结构 是 关于 消息 队列 的 内 核 数据 结构 ,在 这 个 结构 中 保存 着 消 
息 队 列 当 前 的 状态 信息 ,XSI 标准 规定 它 至 少 包 括 以 下 的 内 容 : 

struct msqid ds 

t 


struct ipc perm msg pem; /* structure describing cperation pemission* / 
time t msg stime; /* time of last msgsnd cammand* / 

time t msg rtime; /* time of last msgrcv Command# / 

time t meg ctime; /* time of last change* / 

msgqnum t msg qnum; /* nuber of messages currently on queue * / 
msglen t msg doytes; /* max number of bytes allowed on queue * / 
pid t msg lspid; /* pid of last msgsnd() * / 


pid t msg lrpid; /* pid of last msgrcv() * / 
U 
该 类 型 定义 位 于 bits/msq. h 头 文件 中 ,其 中 msg_perm 保存 了 消息 队列 的 存 取 权 
限 、 队 列 的 用 户 ID、 组 ID 等 信息 ,具体 内 容 可 查看 ipc_perm 类 型 的 定义 。 
752 消息 队列 相关 系统 调用 


使 用 消息 队列 实现 进程 间 通 信 的 原理 如 图 7.7 所 示 : 发 送 方 创建 消息 队列 ,随后 发 
送 消息 ;接收 方 引用 发 送 方 创建 的 消息 队列 ,接收 消息 ;消息 队列 使 用 完毕 后 ,删除 消息 
队列 。 


创建 消息 队列 — | 发 送 消息 接收 消息 | Y 2| 删除 消息 队列 
i N 


图 7.7 消息 队列 通信 的 原理 


1 


1. 创建 消息 队列 一 一 msgget 
创建 消息 队列 使 用 msgget 函数 ,该 函数 接口 规范 说 明 如 表 7. 11 所 示 。 
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表 7.11 msgget 函数 的 接口 规范 说 明 


函数 名 称 msgget 

函数 功能 创建 消息 队列 

头 文件 # include<sys/msg. h> 

函数 原型 int msgget(key_t key, int flag); 


key: 生成 消息 队列 ID 号 所 使 用 的 键 


参数 flag. 消息 队列 的 使 用 权限 


>—1: 消息 队列 的 ID 号 


snk 一 1: 失败 


调用 msgget 函数 创建 消息 队列 时 ,参数 key 可 以 使 用 7.4.3 节 中 讲述 的 几 种 方法 ， 
参数 flag 的 设置 和 shmget、semget 函数 方法 相同 ,可 使 用 的 参数 见 7. 2. 2 节 。 

2. 发 送 消息 msgsnd 

消息 队列 创建 成 功 后 ,可 使 用 msgsnd 函数 发 送 消 息 ,该 函数 接口 规范 说 明 如 
表 7.12。 


表 7. 12 msgsnd 函数 的 接口 规范 说 明 


函数 名 称 msgsnd 

函数 功能 发 送 一 个 消息 到 消息 队列 

头 文件 £ include sys/msg. h> 

函数 原型 int msgsnd(int msqid, void * ptr, size t nbytes, int flag) ; 


msqid; 消息 队列 的 ID 号 
ptr: 指向 待 发 送 消息 的 指针 


参数 nbytes: 消息 的 大 小 

flag: 当 消 息 队列 已 满 时 ,如 何 处 理 
0: 成 功 
返回 人 一 1: 失败 


调用 msgsnd 函数 ,表示 要 将 指针 ptr 所 指 的 ,长度 为 nbytes 的 消息 发 送 到 ID 号 为 
msqid 的 消息 队列 中 去 ,如 果 该 消息 队列 已 满 , 则 按照 flag 所 设置 的 方式 处 理 。 

参数 ptr 所 指向 的 对 象 类 型 需要 由 用 户 来 定义 ,在 该 类 型 定义 中 ,必须 包含 消息 的 类 
型 ( 正 数 ) 和 消息 的 数据 ,因此 它 是 一 个 结构 体 类 型 。 例 如 以 下 的 类 型 定义 是 允许 使 用 的 : 


struct mymsg 

{ 
long msgtype; 
char msgtext[256]; 


在 这 个 类 型 定义 中 ,发 送 的 消息 长 度 为 256 字 节 ,可 以 使 用 msgtype 成 员 来 区 分 不 同 
类 型 的 消息 。 


sel 
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另 一 个 参数 flag 用 于 设置 在 消息 队列 已 满 时 ，msgsnd 函数 做 出 怎样 的 反应 。 当 
flag 被 设置 为 IPC_NOWAIT 时 , 若 消息 队列 已 满 , 则 使 用 msgsnd 立即 出 错 ;flag 设置 为 
0 时 ,消息 队列 如 果 已 满 ,调用 msgsnd 的 进程 被 挂 起 ,直到 消息 队列 可 接收 该 消息 或 该 队 
列 被 删除 或 进程 捕捉 到 信号 ,从 信号 处 理 程序 中 返回 。 

msgsnd 因数 调用 成 功 时 ,相关 消息 队列 的 msqid_ds 结构 中 的 某 些 属性 也 会 相应 地 
做 出 修改 。 

3. 接收 消息 一 一 msgrev 

消息 发 出 后 ,接收 方 进程 可 以 使 用 msgrcv 函数 接收 消息 。 该 函数 接口 规范 说 明 如 
表 7.13 所 示 。 


表 7.13 msgrev 函数 的 接口 规范 说 明 


函数 名 称 msgrcv 

函数 功能 从 消息 队列 接收 一 个 消息 

头 文件 & include sys/msg. h> 

函数 原型 int msgrcv(int msqid, void * ptr, size t nbytes, long type, int flag); 


msqid: 消息 队列 的 ID 号 

ptr: 指向 待 发 送 消息 的 指针 

参数 nbytes: 消息 的 大 小 

type: 消息 类 型 

flag: 当 消息 队列 为 空 时 ,如 何 处 理 


20, 消息 中 数据 部 分 的 长 度 
一 1: 失败 


返回 值 


在 msgrcv 函数 中 ,参数 ptr 的 含义 与 msgsnd 中 的 类 似 ,也 需要 用 户 自行 定义 相应 的 
消息 类 型 。 参 数 nbytes 指明 接收 的 消息 的 长 度 , 当 消息 长 度 大 于 nbytes 时 , 若 flag 中 设 
ff MSG_NOERROR , 则 截 短 该 消息 ;如 未 设置 , 则 出 错 返回 ,消息 仍 在 队列 中 。 参 数 
type 用 来 指定 接收 消息 的 类 型 ; 

* type=0 时 ,返回 队列 中 的 第 一 个 消息 。 

* type>0 时 ,返回 队列 中 类 型 为 type 的 第 一 个 消息 。 

* type<0 时 ,返回 队列 中 消息 类 型 值 小 于 或 等 于 一 type 的 消息 ,如 果 这 种 消息 有 多 

个 , 则 取 类 型 值 最 小 的 消息 。 

参数 flag 用 来 设置 当 队 列 为 空 时 , msgrcv 函数 如 何 处 理 , 当 flag 设置 为 IPC_ 
NOWAIT 时 , 若 没 有 符合 条 件 的 消息 , 则 msgrcv 返回 一 1; 如 flag 未 设置 , 则 进程 阻塞 直 
到 有 了 满足 条 件 的 消息 或 从 系统 中 删除 了 该 队列 或 进程 捕捉 到 一 个 信号 并 从 信号 处 理 程 
序 返 回 。 

4. 操作 消息 队列 一 一 msgctl 

当 队 列 使 用 完毕 后 ,可 使 用 函数 msgctl 来 删除 消息 队列 ,该 函数 接口 规范 说 明 如 
表 7.14 所 示 。 
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3 7.14. msgctl 函数 的 接口 规范 说 明 


函数 名 称 msgctl 

函数 功能 操作 消息 队列 

头 文件 Ë include sys/msg. h> 

函数 原型 int msgctl(int msqid, int cmd, struct msgid ds * buf); 
msgid: 消息 队列 的 ID 号 

参数 cmd: 待 执行 的 操作 
buf: 存放 消息 队列 属性 的 内 存 地 址 

" 0: 成 功 

n 一 1: 失败 


msgctl 函数 和 shmctl、semctl 函数 类 似 ,可 以 对 消息 队列 做 多 种 操作 ,cmd 可 以 设置 
为 以 下 的 几 个 操作 : 
IPC STAT: 获取 消息 队列 的 msqid_ds 结构 ,将 其 存放 在 由 buf 指向 的 结构 中 。 
IPC_SET: 按 buf 所 指 结构 中 的 值 设 定 此 队列 相关 结构 中 的 msg_perm. uid、 msg 
perm. gid、msg_perm. mode, msg perm. qbytes. 


IPC RMID; 从 系统 中 删除 消息 队列 及 其 中 的 数据 。 
753 使 用 消息 队列 实现 进程 间 通 信 


本 节 使 用 消息 队列 的 相关 系统 调用 来 实现 进程 间 的 通信 。 示 例 程 序 7. 8 是 一 对 发 
送 / 接 收 信息 的 程序 ,其 中 示例 程序 7. 8-1 是 发 送 方 的 代码 ,示例 程序 7. 8-2 是 接收 方 的 
代码 。 

[示例 程序 7.8- 1 msg_sender.c] 

# include< stdlib.h> 

# include< stdio.h> 


# include< unistd.h> 
# include< string.h> 
# include< sys/ipc.h» 
# include< sys/msg.h> 


# define MAX TEXT 512 // 消 息 的 最 大 长 度 
struct msg st // 消 息 类 型 定义 
f 


intmsg type; 
charmsg text[MAX TEXT]; 


int mein() 
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struct msg st senddata; 
char buf [80]; 
if((key- ftok(".",512))-- - 1) // 生 成 键 值 
t 
perror ("ftok") ; 
exit(EXIT FAIIDRE) ; 
i 
if ((msgid=msgæt (key, IFC_CREAT| 0666))==- 1) // 创 建 消息 队列 
t 
perror ("msgget") ; 
exit(EXIT FAILURE) ; 
) 
while(1) 
t 
printf ("Enter the message to send:"); 
fflush(stdin); 
scanf ("$3",buf) ; 
senddata.msg type- 1; 
strcpy(senddata.msg text,buf); 


if((msgsnd(msgid, (void * )&senddata,MAX TEXT,0))---1) // 发 送 消 息 
i 
perror (megsnd") ; 
exit(EXIT FAIIUFE); 
) 
if(stram (ouf, "That's the end!")-—0) break; 
) 
return 0; 
} 


示例 程序 7. 8-1 中 ,发 送 方程 序 首先 定义 了 消息 的 类 型 ,随后 调用 ftok 函数 生成 一 个 
键 值 用 于 创建 消息 队列 ,调用 msgget 函数 创建 消息 队列 之 后 ,发 送 方 进程 从 键盘 输入 信 
息 ,向 消息 队列 发 送 消息 。 示 例 程序 7. 8-2 中 ,接收 方程 序 定 义 了 与 发 送 方 相同 的 消息 类 
型 ,随后 使 用 msgget 引用 发 送 方 创建 的 消息 队列 ,接收 消息 ;接收 完毕 后 ,接收 方 删除 消 
息 队 列 。 


[示例 程序 7.8- 2 msg. receiver.c] 
# includec stdlib.h» 

# include< stdio.h> 

# include< unistd.h> 

# include< string.h> 

# include< sys/ipc.h> 

# include< sys/msg.h» 


# define MX TEXT 512 


struct msg st 
t 

intmsg type; 

charmsg text[MAX TEXT]; 
IH 


int main() 
t 
struct msg st recdata; 
int key, msgid; 
if((key- ftok(".",512))- - - 1) 
t 
perror ("ftok") ; 
exit(EXIT FAIIDRE); 
) 
if ((msgid- msgget (key, 0666) )- — - 1) 
i 
perror ("msgget") ; 
exit(EXIT FAILURE); 
while(1) 
{ 


if (msgrcv (msgid, (void * )&recdata,512,0,0)==-1)  // 接 收 消息 


t 
perror ("nsgrcv") ; 
exit(EXIT FAIIUFE); 
) 


// 消 息 的 最 大 长 度 


// 消 息 类 型 


// 生 成 键 值 


// 引 用 消息 队列 


printf ("message Teceived is :$sWn",reodata.msg text); 


if (strap (recdata.msg text,"That's the end!")- — 0) 


break; 

} 
if (msgctl (msgid, IPC FMID,0)-- - 1) 
t 

perror ("msgct1") ; 

exit(EXIT FAILURE); 
i 
retum 0; 

} 


// 删 除 消息 队列 
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消息 队列 与 共享 内 存 不 同 之 处 在 于 : 内 核 要 保证 消息 队列 FIFO 的 性 质 ,因此 当 有 
多 个 接收 方 进程 接收 消息 队列 中 的 数据 时 ,不 会 产生 冲突 ,由 内 核 来 协调 它们 的 执行 顺 
序 。 另 外 ,由 于 发 送 方 发 送 的 消息 添加 在 队 尾 , 接 收 方 从 队 首 接收 消息 ,因此 读 、 写 操作 也 


不 存在 冲突 。 
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7.6 小 结 


进程 间 通 信和 是 系统 级 程序 在 实现 时 需要 解决 的 一 个 问题 ,Linux 系统 提供 了 多 种 进 
程 间 通信 的 机 制 。 本 章 通过 一 个 服务 器 /客户 端的 程序 实例 着 重 介绍 了 使 用 文件 .管道 和 
共享 内 存 机 制 如 何 实现 进程 间 的 通信 。 随 后 引入 信号 量 机 制 ,解决 了 多 进程 使 用 共享 内 
存 通信 时 的 同步 互 斥 问题 。 

随后 的 章节 介绍 了 Linux 操作 系统 中 的 进程 间 通信 机 制 及 各 种 机 制 的 适用 场合 。 管 
道 、 信 号 机 制 在 之 前 的 章节 已 做 了 介绍 , 套 接 字 机 制 将 在 后 面 的 章节 中 学 习 , 本 章 主要 介 
绍 System V IPC 的 使 用 。7. 4 节 中 介绍 了 System V IPC 的 基本 情况 ,并 说 明了 如 何 使 
用 ftok 函数 获得 键 值 , 可 使 用 该 键 值 创建 所 需要 的 IPC 对 象 。 

本 章 最 后 介绍 了 消息 队列 这 一 通信 机 制 , 这 种 机 制 也 是 经 常会 使 用 到 的 一 种 同一 主 


机 内 进程 间 通 信 的 机 制 。 
习 题 
一 、 填空 题 
1. Linux 支持 的 3 种 System V 进程 间 通 信和 机 制 是 、 和 e 
2. 创建 一 个 System V IPC 资源 时 ,需要 指定 值 和 使 用 该 资源 的 
3. 消息 队列 是 一 条 由 消息 连接 而 成 的 , 它 保存 在 内 核 中 ,可 通过 消息 队列 
的 来 访问 。 
4. 信号 量 用 来 控制 多 个 进程 对 的 访问 。 
5. 理论 上 来 看 ,最 快 的 通信 机 制 是 o 
6. 列 出 系统 内 IPC 资源 的 命令 是 ,删除 某 个 IPC 资源 的 命令 是 e 
二 、 简 答题 


1. 进程 间 通 信 有 哪些 方式 ? 通信 有 哪些 目的 ? 

2. 请 简 述 共 享 内 存 的 工作 原理 。 

3. 信号 量 机 制 是 否 可 以 单独 胜任 进程 间 数 据 通信 的 工作 ? 

三 、 编 程 题 

1. 在 示例 程序 7. 1 的 基础 上 ,编写 程序 实现 使 用 信号 量 机 制 来 协调 读 、 写 进程 对 记 
录 随 机 数 文件 的 访问 。 

2. 使 用 消息 队列 编写 两 个 通信 的 程序 ,发 送 方 将 在 当前 工作 目录 中 执行 ls -1 的 结果 
发 送 给 接收 方 , 接 收 方 将 结果 显示 在 屏幕 上 。 

3. 使 用 共享 内 存 编 写 两 个 通信 的 程序 ,发送 方 将 在 当前 工作 目录 中 执行 ls -1 的 结果 
发 送 给 接收 方 , 接 收 方 将 结果 显示 在 屏幕 上 。 

4. 编写 程序 用 信号 量 来 解决 读者 写 者 问题 ,其 中 读者 、 写 者 均 为 一 组 进程 。 
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进程 是 操作 系统 中 资源 管理 的 最 小 单位 ,是 程序 执行 的 最 小 单位 。20 世纪 80 年 代 
中 期 ,操作 系统 中 引入 了 线程 的 概念 。 引 入 线程 后 ,进程 仍 作为 拥有 资源 的 独立 单位 ,但 
不 再 是 独立 调度 和 分 派 的 基本 单位 ,不 需要 进行 频繁 地 切换 ;线程 作为 系统 调度 和 分 派 的 
基本 单位 ,而 不 是 资源 分 配 的 基本 单位 ,因此 线程 可 以 轻装 运行 ,并 进行 频繁 的 调度 和 切 
换 , 使 系统 获得 更 好 的 并 发 度 。 


8.1 线程 概述 
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线程 ,又 称 为 轻 量 级 进程 (Lightweight Process,LWP) ,是 计算 机 中 独立 运行 的 最 小 
单位 ,运行 时 占用 很 少 的 系统 资源 。 由 于 每 个 线程 占用 的 CPU 时 间 是 由 系统 分 配 的 , 因 
此 可 以 把 线程 看 作 是 操作 系统 分 配 CPU 时 间 的 基本 单元 。 在 用 户 看 来 ,多 个 线程 是 同 
时 执行 的 ,但 从 操作 系统 角度 来 看 ,各 个 线程 是 交替 与 执行 的 ,系统 不 停 地 在 各 个 线程 之 
间 切 换 , 每 个 线程 只 有 在 系统 分 配给 它 的 时 间 片 内 才能 获得 CPU 的 使 用 权 , 执 行 线程 中 
的 代码 。 

一 个 进程 可 以 拥有 一 个 或 多 个 线程 ,同一 进程 的 多 个 线程 共享 同一 地 址 空间 ,因此 代 
码 段 .数据 段 是 共享 的 。 如 果 定 义 了 一 个 函数 (存储 在 代码 段 ) ,各 线程 都 可 以 进行 调用 ， 
如 果 定 义 了 一 个 全 局 变量 (存储 在 数据 段 ) ,各 个 线程 都 可 以 访问 到 。 除 此 之 外 ,线程 还 共 
享 以 下 进程 资源 和 环境 : 

(1) 文件 描述 符 表 。 

(2) 每 种 信号 的 处 理 方式 。 

(3) 当前 工作 目录 。 

(4) 用 户 ID 和 组 ID。 

线程 也 拥有 其 私有 的 数据 信息 ,包括 : 

CD 线程 号 (也 称 为 线程 ID) ,每 个 线程 都 有 一 个 唯一 的 线程 号 与 之 对 应 。 

(2) 寄存 器 ,包括 程序 计数 器 和 栈 指针 。 

(3) 堆栈 。 

(4) 信号 屏蔽 字 。 

(5) 调度 优先 级 。 
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(6) 线程 私有 的 存储 空间 。 
812 用 户 级 线程 和 内 核 级 线程 


Linux 是 一 种 多 线程 .多 任务 操作 系统 , 它 符合 IEEE POXIS 标准 ,其 线程 分 为 两 种 : 
用 户 级 线程 (User-Level Thread) 和 内 核 级 线程 (Kernel-Level Thread) ,内 核 级 线程 又 称 
为 内 核 支持 的 线程 或 轻 量 级 进程 。 在 Linux 中 ,这 两 种 线程 分 别 使 用 在 /usr/include/ 
asm_i386/processor. h 中 所 定义 的 结构 struct thread struct. 以 及 在 /usr/include/ 
pthread/init/pthread. h 中 所 定义 的 结构 struct pthread 进行 描述 。 

用 户 级 线程 是 由 进程 负责 调度 管理 ,不 需要 内 核 支持 而 在 用 户 程序 中 实现 的 线程 ,不 
依赖 于 操作 系统 内 核 ,通常 ,用 户 态 线程 在 线程 切换 时 要 比 内 核 级 线程 的 速度 快 。 用 户 级 
线程 对 程序 员 来 说 是 可 见 的 ,而 对 内 核 来 说 是 未 知 的 ,用 户 空间 的 线程 库 通常 用 以 管理 用 
户 级 线程 ,线程 库 提供 对 线程 创建 .调度 和 管理 的 支持 。 

内 核 级 线程 是 由 操作 系统 支持 和 管理 ,在 内 核 空间 实现 线程 创建 .调度 和 管理 ,内 核 
维护 进程 及 线程 的 上 下 文 信息 以 及 线程 切换 。 由 于 内 核 参与 了 用 户 态 进程 的 调度 ,因此 
就 涉及 了 内 核 态 与 用 户 态 上 下 文 的 切换 。 通 常 所 说 的 内 核 态 线程 切换 速度 慢 就 是 由 于 这 
个 原因 导致 的 。 一 个 内 核 级 线程 由 于 1/O 操作 而 阻塞 ,不 会 影响 其 他 线程 的 运行 。 

用 户 级 线程 与 内 核 级 线程 的 区 别 : 

CD 用 户 级 线程 是 操作 系统 内 核 不 可 感知 的 ;而 内 核 级 线程 是 操作 系统 内 核 可 感 
知 的 。 

(2) 用 户 级 线程 的 创建 、 撤 销 和 调度 不 需要 操作 系统 内 核 的 支持 ;而 内 核 支持 线程 的 
创建 .撤销 和 调度 都 需要 操作 系统 内 核 提供 支持 。 

(3) 用 户 级 线程 执行 系统 调用 指令 时 将 导致 其 所 属 进 程 被 中 断 ; 而 内 核 级 线程 执行 
系统 调用 指令 时 ,只 导致 该 线程 被 中 断 。 

(4) 在 只 有 用 户 级 线程 的 操作 系统 内 ,CPU 调度 以 进程 为 单位 ,处 于 运行 状态 的 进 
程 中 的 多 个 线程 ,由 用 户 程序 控制 线程 的 运行 ;在 有 内 核 支持 线程 的 操作 系统 内 ,CPU 调 
度 则 以 线程 为 单位 ,由 操作 系统 的 线程 调度 程序 负责 线程 的 调度 。 

(5) 用 户 级 线程 的 程序 实体 是 运行 在 用 户 态 下 的 程序 ;而 内 核 级 线程 的 程序 实体 则 
是 可 以 运行 在 任何 状态 下 的 程序 。 


813 线程 与 进程 的 对 比 


Linux 操作 系统 是 支持 多 线程 的 ,一 个 进程 可 以 拥有 一 个 或 多 个 线程 ,多 个 线程 可 以 
同时 运行 。 为 什么 在 支持 多 进程 的 情况 下 又 引入 多 线程 呢 ? 这 是 因为 多 线程 相对 于 多 进 
程 ,具有 以 下 优点 : 

CD 在 多 进程 情况 下 ,每 个 进程 都 拥有 自己 独立 的 地 址 空间 ,而 在 多 线程 情况 下 , 同 
一 进程 内 的 子 线程 资源 共享 进程 的 地 址 空间 。 因 此 ,创建 一 个 新 的 进程 时 就 要 耗费 CPU 
时 间 来 为 其 分 配 系统 资源 ,这 是 一 种 “昂贵 ”的 多 任务 工作 方式 ;而 创建 一 个 新 的 线程 花费 
的 时 间 则 要 少 很 多 , 它 是 一 种 “节俭 ”的 多 任务 操作 方式 。 

(2) 在 系统 调度 方面 ,由 于 进程 地 址 空间 独立 ,而 线程 共享 地 址 空间 ,线程 间 的 切换 
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速度 要 比 进程 间 的 切换 速度 快 很 多 。 

(3) 在 通信 机 制 方面 ,进程 间 的 数据 空间 相对 独立 ,彼此 通信 要 以 专门 的 通信 方式 
进行 ,通信 时 必须 经 过 操作 系统 ,同一 进程 内 的 多 个 线程 共享 数据 空间 ,一 个 线程 的 数 
据 可 以 直接 提供 给 其 他 线程 使 用 ,而 不 必 经 过 操作 系统 ,因此 线程 间 的 通信 更 加 方便 


和 省 时 。 


进程 是 操作 系统 管理 资源 的 基本 单元 ,而 线程 是 系统 调度 的 基本 单元 。 进 程 和 线程 
在 应 用 层面 的 API 函数 又 有 很 多 相似 之 处 。 表 8. 1 列 出 了 Linux 操作 系统 中 进程 和 线 


程 基本 操作 应 用 对 比 。 
表 8.1 进程 /线程 基本 操作 应 用 对 比 
应 用 功能 线 程 进 程 
创建 pthread create fork, vfork 
退出 return thread exit exit,return, exit 
等 待 pthread_join wait, waitpid 
取消 /终止 ”| pthead cancel abort 
读 取 ID pthread self getpid 
调度 策略 SCHED OTHER,SHCED FIFO,SCHED RR 
通信 机 制 信号 量 、 信 号 、 互 斥 锁 、 条 件 变 量 、 读 | 匿名 管道 ,命名 管道 、 信 号、 消息 队列 、 信 和 号 量 、 
写 锁 共享 内 存 


8.2 线程 基本 操作 


Linux 系统 支持 POSIX 多 线程 接口 , 称 为 pthread POSIX Thread 的 简称 )。 编 写 
Linux 下 的 多 线程 应 用 程序 ,需要 使 用 头 文件 pthread. h。 


821 线程 创建 


如 果 线 程 可 在 进程 执行 期 间 的 任意 时 刻 被 创建 ,并 且 线 程 的 数量 事先 不 需要 指定 ,这 
样 的 线程 称 为 动态 线程 。 线 程 的 创建 可 使 用 pthread createO 函数 来 完成 。 
pthread create 函数 接口 规范 说 明 如 表 8. 2 所 示 。 


表 8.2  pthread create 函数 的 接口 规范 说 明 


函数 名 称 | pthread_create 

函数 功能 | 创建 一 个 新 的 线程 

头 文件 # include — pthread. h> 

函数 原型 int pthread create(pthread t * thread, const pthread attr t * attr, void * ( * start | 


routine) (void * ). void * arg); 
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thread: 指向 线程 标识 符 的 指针 ,用 来 存储 线程 标识 符 

atr; 设置 线程 属性 ,主要 设置 与 栈 相关 的 属性 。 一 般 情况 下 ,该 参数 设置 为 NULL, 新 
参数 的 线程 将 使 用 系统 默认 的 属性 

start routine; 是 线程 运行 函数 的 起 始 地 址 , 即 在 此 线程 中 运行 哪 段 代码 

arg: 运行 函数 的 参数 地 址 


返回 什 如 果 线 程 创 建成 功 ,返回 0。 如 果 创建 失败 , 则 返回 出 错 编 号 
创建 成 功 时 ,由 thread 指向 的 内 存单 元 被 设置 为 新 创建 线程 的 线程 ID 


续 表 


说 明 : 线程 标识 符 在 某 个 进程 中 是 唯一 的 ,也 就 是 说 ,如 果 父 子 进 程 中 创建 多 个 线 
FE ,线程 标识 符 有 可 能 相同 。 
注意 : pthread 不 是 Linux 系统 默认 的 库 , 而 是 POSIX 线程 库 。 在 Linux 中 将 其 作 
为 一 个 库 来 使 用 ,因此 在 编译 时 需要 加 上 -lpthread( 或 -pthread) 以 显 式 链接 该 库 。 
在 pthread. h 中 还 声明 了 pthread_self 函数 ,用 于 获取 当前 线程 自身 的 TD ,该 函数 的 
接口 规范 说 明 如 表 8. 3 所 示 。 
38.3  pthread self 函数 的 接口 规范 说 明 


函数 名 称 pthread self 

函数 功能 获取 线程 ID 

头 文件 # include <pthread. h> 
函数 原型 pthread t pthread self(void) ; 
参数 无 

返回 值 20; 返回 调用 线程 的 ID 


在 示例 程序 8. 1 中 ,使 用 pthread 线程 库 创建 一 个 新 线程 ,在 主线 程 ( 也 称 为 父 进程 ) 
和 新 线程 中 分 别 显示 进程 ID 和 线程 ID。 


[示例 程序 8.1 exp printid.c] 
# include< stdio.h> 

# include< stdlib.h» 

# includec sys/types.h» 

# includec unistd.h» 

# includec pthread.h> 


void printids (const char * s) 
t 

pidt pid; 

pthread t tid; 


pid-getpid(); 
tid-pthread self(); 
printf("$s pid is $u,tid is $1u (0x$1x)Wn", s, pid, tid,tid); 
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void* thr fn(void * arg) 
{ 
printids ("new thread:"); 
return((void* )0); 


int main() 

{ 
int ret; 
pthread t ntid; 


ret-pthread create(sntid, NULL, thr fn, NULL); 
if(ret!- 0) 
1 
printf ("can't create threadWn") ; 
exit(1); 
) 
printids ("main thread:") ; 
sleep); 
exit(0); 
} 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 
root@ubuntu:~  ./exp printid 


main thread: pid is 2887,tid is 139658671326976 (Qx7f04d17e8700) 
new thread: pid is 2887,tid is 139658663016192 (0x7f04d0ffb700) 


从 运行 结果 可 以 看 出 ,主线 程 和 新 线程 的 进程 ID 值 相同 ,都 是 2887; 主 线程 和 新 线 
程 的 线程 ID 不 同 , 它 们 的 值 很 大 ,是 一 个 线程 结构 的 地 址 。 
注意 : 在 示例 中 ,使 用 了 pthread 的 数据 结构 : pthread_t, 这 个 结构 用 来 标识 线 


程 ID。 
在 示例 程序 8. 2 中 ,使 用 pthread_create() 函 数 创建 新 线程 ,新 创建 的 线程 和 主线 程 


各 循环 打印 10 次 。 


[示例 程序 8.2 exp_create.c] 
# include< stdio.h> 
# include< stdlib.h» 
# include< pthread.h> 
void thread (void) 
{ 
inti; 
for(i-0;i« 10;i++) 
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printf ("his is a pthread.TID: $1uWn",pthread self()); 
} 
t 
pthread t id; 
int iret; 
ret-pthread create (&id,NULL, (void * )thread,NULL) ; 
if(ret!- 0) 
t 
printf ("Create pthread error! An") ; 
exit(); 
} 
for(i=0;i< 10;i++) 
printf ("This is the main prooess.TID:%lu\n",pthread self()); 
pthread join(id,NULL) ; 
retum (0); 
) 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp create 

This is the main Process.TID:139973092792064 
This is the main Process.TID:139973092792064 
This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is the main process.TID:139973092792064 
This is the main process.TID:139973092792064 
This is the main process.TID:139973092792064 
This is the main process.TID: 139973092792064 
This is the main process.TID:139973092792064 
This is the main process.TID:139973092792064 
This is the main process.TID: 139973092792064 
This is the main process.TID:139973092792064 
This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 

This is a pthread.TID: 139973084468992 


从 运行 结果 可 以 看 出 ,线程 之 间 是 交替 执行 的 。 
822 线程 退出 等 待 


1. 线程 退出 操作 
线程 通过 调用 pthread_exit() 函数 终止 执行 ,就 如 同 进程 在 结束 时 调用 exit 函数 一 


第 8 章 ”线程 


样 。 这 个 函数 的 作用 是 ,终止 调用 它 的 线程 并 返回 一 个 指向 某 个 对 象 的 指针 ,这 个 指针 不 
能 是 局 部 变量 的 指针 ,因为 局 部 变量 会 在 线程 出 现 严重 问题 时 消失 。 该 接口 规范 说 明 如 
表 8.4 所 示 。 

表 8.4  pthread exit 函数 的 接口 规范 说 明 


函数 名 称 pthread exit 

函数 功能 结束 调用 线程 

头 文件 * include <pthread. h> 

函数 原型 void pthread exit(void * retval); 

参数 retval: void 类 型 的 指针 ,指向 退出 信息 
返回 值 无 


新 创建 的 线程 从 执行 用 户 定义 的 函数 处 开始 执行 ,直到 出 现 以 下 情况 时 退出 : 

CD 调用 pthread_exit OB H 

(2) 其 他 线程 调用 pthread_cancel 函数 取消 该 线程 , 且 该 线程 可 被 取消 。 

(3) 创建 线程 的 进程 退出 或 者 整个 函数 结束 。 

(4) 其 中 的 一 个 线程 执行 了 exec 类 函数 执行 新 的 代码 ,替换 当前 进程 所 有 地 址 
空间 。 

(5) 当前 线程 代码 执行 完毕 。 

注意 : 使 用 pthread_exit 系统 调用 可 以 结束 一 个 线程 ,其 结束 方式 与 进程 调用 exit() 
函数 类 似 。 此 函数 只 有 一 个 参数 , 即 线程 退出 状态 。 

2. 线程 等 待 操作 

一 般 情况 下 ,为 了 有 效 同步 子 线程 ,在 主线 程 中 ,都 将 等 待 子 线程 结束 , 显 式 地 等 待 线 
程 结束 可 以 使 用 pthread_join 函数 。 该 接口 规范 说 明 如 表 8. 5 所 示 。 

表 8.5 pthread join 函数 的 接口 规范 说 明 


函数 名 称 pthread_join 

函数 功能 等 待 男 一 个 线程 结束 

头 文件 # include <pthread. h> 

函数 原型 int pthread join(pthread t thread, void **retval) ; 


thread: 要 等 待 线程 的 pid 


参数 retval: 用 来 存储 被 等 待 线程 的 返回 值 
0. 成 功 
aiam 错误 号 : 失败 


在 示例 程序 8. 3 中 主线 程 调用 pthread_create 函数 创建 了 两 个 线程 ,并 使 用 pthread 
join 函数 接收 这 两 个 线程 的 退出 状态 。 


[示例 程序 8.3 exp exit.c] 
# include< stdio.h> 


# include< pthread.h» 
void * print message function(void * ptr) 
t 
char * data- "study linux"; 
char * message; 
message — (char * ) ptr; 
printf("$s Nt", message) ; 
printf("PID: $1d Wn", pthread self()); 
pthread exit ((void * ) data); 
} 
void main (void) 
í 
pthread t threadl, thread?; 
char * messagel = "Thread 1"; 
char * message? = "Thread ?' 
int retl, ret2; 
void * pth join retl; 
void * pth join ret2; 


retl-pthread create( &threadl, NULL, print message functicn, 
(void* )"thread one here"); 

ret2- pthread create( &thread2, NULL, print message function, 
(void* ) message?) ; 

pthread join(threadl, &pth join retl); 

pthread join thread2，spth join ret2); 


printf ("Ihread 1 returns: $dW",retl); 
printf ("Thread 2 returns: $dW", ret2); 
printf ("pthread join 1 returns: $sWn", (char * )pth join retl); 
printf ("pthread join 2 returns: %s\n", (char * )pth join ret2); 
exit(0); 

H 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp exit 

Thread 2 PID: 140713554876160 
thread one here PID: 140713563268864 
Thread 1 retums: 0 

Thread 2 retums: 0 

pthread join 1 retums: study linux 


pthread join 2 retums: study linux 
3. 其 他 操作 
线程 退出 时 最 重要 的 问题 是 资源 释放 的 问题 ,特别 是 对 一 些 临界 资源 的 处 理 。 临 界 
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资源 在 一 段 时 间 内 只 能 被 一 个 线程 所 持 有 , 当 线程 要 使 用 临界 资源 时 须 提 出 请 求 , 如 果 该 
资源 未 被 使 用 则 申请 成 功 ,否则 等 待 。 临 界 资源 使 用 完毕 后 要 释放 以 便 其 他 线程 可 以 使 
用 ,例如 , 某 线程 要 写 一 个 文件 ,在 写 文件 时 ,不 允许 其 他 线程 对 该 文件 执行 写 操作 ,否则 
会 导致 文件 数据 混乱 。 这 里 的 文件 就 是 一 种 临界 资源 。 临 界 资源 为 一 个 线程 所 独占 , 当 
一 个 线程 退出 时 ,如 果 不 放弃 占有 的 临界 资源 , 则 该 资源 会 被 认为 仍 被 已 经 退出 的 线程 所 
使 用 ,永远 不 会 得 到 释放 ,如 果 另 一 个 线程 在 等 待 使 用 这 个 临界 资源 , 它 就 可 能 无 限 等 待 
下 去 ,这 就 形成 了 死 锁 ,而 这 往往 是 灾难 性 的 。 

为 此 ,Linux 提供 了 一 对 函数 : pthread_cleanup_push 和 pthread_cleanup_pop PÁ% 
为 用 户 自动 释放 资源 。 这 两 个 函数 的 接口 规范 说 明 如 表 8.6 和 表 8.7 所 示 。 


表 8.6  pthread cleanup push 函数 的 接口 规范 说 明 


函数 名 称 pthread cleanup push 

函数 功能 注册 清理 函数 

头 文件 #include <pthread. h> 

函数 原型 void pthread cleanup push(void ( * routine) (void * ); 
参数 routine; 要 注册 的 函数 

返回 值 无 


表 8.7 pthread_cleanup_pop 函数 的 接口 规范 说 明 


函数 名 称 pthread_cleanup_pop 

函数 功能 弹出 清理 函数 

头 文件 # include — pthread. h> 

函数 原型 void pthread_cleanup_pop(int execute) ; 

参数 execute 为 0 表示 函数 弹出 时 不 执行 , 非 0 为 执行 
返回 值 无 


这 两 个 清理 函数 在 以 下 情况 会 被 执行 : 

CD 当 一 个 线程 被 取消 时 ,这 些 清理 函数 会 以 与 push 注册 时 相反 的 顺序 被 执行 , 且 
执行 后 从 栈 中 被 移 除 。 

(2) 通过 调用 函数 pthread_exit() 终 止 线 程 时 ,这 两 个 清理 函数 会 被 调用 ,如 果 使 用 
return 语句 来 终止 线程 , 则 不 会 调用 这 些 清理 函数 。 

(3) 当 调 用 pthread_cleanup_pop() 函 数 且 其 参数 为 非 零 时 ,就 调用 栈 顶 的 清理 函数 
执行 , 且 执 行 完 后 ,将 该 清理 函数 从 栈 中 移 除 。 

这 两 个 函数 是 以 宏 形式 提供 的 : 

# include pthread.h> 

f define pthread cleanup push (routine,arg) V 

(struct  pthread cleanup buffer buffer; V 


、 rns 


_pthread cleanup push(& buffer, (routine), (arg)); 


# define pthread cleanup pop(execute) V 
| pthread cleanup pop(& buffer, (execute)); V 
} 


注意 : pthread_cleanup_push() 带 有 一 个 “{”, 而 pthread_cleanup_pop() 带 有 一 个 
*)" ,因此 这 两 个 函数 必须 成 对 出 现 , 且 必须 位 于 程序 的 同一 级 别 的 代码 段 中 才能 通过 编 
译 , 如 示例 程序 8.4 所 示 。 


[示例 程序 8.4 exp cleanup.c] 
# includec stdio.h» 

# includec stdlib.h> 

# include< pthread.h» 


void* clean(void* arg) 

t 
printf("cleanup:$s Wn", (char* )arg); 
return (void* )0; 


void* thread funcl(void* arg) 
t 

printf ("thread funcl start\n"); 

pthread cleanup push((void* )clean, "threadl first handler"); 

pthread cleanup push((void* )clean, "threadl second handler"); 

printf ("threadl push oampleteWn") ; 

if (arg) 

t 

return ((void* )1); 


pthread cleanup pop(1); 
pthread cleanup pop(1); 
retum (void* )1; 


void* thread func2(void* arg) 

{ 
printf ("thread func? startNn") ; 
pthread cleanup push((void* )clean, "thread? first handler"); 
pthread cleanup push((void* )clean, "thread? second handler"); 
printf ("thread? push oamleteWn") ; 
if (arg) 
{ 


pthread exit((void* )2); 


int main(int argc, char** argv) 


t 


int ret; 
void * pth join ret-0; 
pthread t ptidl,ptid?2; 


ret-pthread create(&ptidl, NULL, thread funcl, (void* )1); 


if (ret !- 0) 

1 
printf ("pthreadl create failedWn"); 
exit(1); 


ret-pthread create(&ptid2, NULL, thread func2, (void* )1); 


if (ret !- 0) 

1 
printf ("pthread? create failed"); 
exit(1); 

) 


ret-pthread join(ptidl, &pth join ret); 
if (ret !- 0) 
1 
printf ("pthread join 1 failed"); 
exit(); 
H 


printf ("pthreadl exit, code is d\n", (int)pth join ret); 


ret-pthread join ptid2，spth join ret); 
if (ret !=0) 
{ 
printf ("pthread join 1 failed\n"); 
exit(1); 
) 


printf ("pthread? exit, code is d\n", (int)pth join ret); 
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printf ("test over!Xn") ; 


return 0; 
} 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


rootGubuntu:- # ./exp cleanup 
thread func start 

thread? push complete 
cleanup:thread? second handler 
cleanup:thread? first handler 
thread funcl start 

thread! push complete 
pthreadl exit, code is 1 
pthread? exit, code is 2 


test over! 
从 运行 结果 可 以 看 出 , 当 push 和 pop 之 间 的 代码 有 return 时 ,即使 pop 的 参数 为 1， 
也 不 执行 push 中 的 清除 函数 。 


823 线程 终止 


Linux 允许 一 个 线程 终止 另外 一 个 线程 的 执行 , 即 一 个 线程 可 以 向 另外 一 个 线程 发 
出 终止 请 求 。 根 据 不 同 的 设置 ,接收 到 这 个 终止 请 求 的 线程 可 以 忽略 这 个 请 求 , 也 可 以 立 
即 终止 或 者 延长 一 段 时 间 后 终止 。 一 个 线程 能 够 被 取消 并 终止 执行 需要 满足 以 下 条 件 : 

(1) 线程 是 否 可 以 被 取消 ,创建 线程 时 默认 设置 是 可 以 被 取消 。 

(2) 线程 处 于 可 取消 点 才能 被 取消 。 也 就 是 说 ,即使 一 个 线程 被 设置 为 可 以 取消 状 
态 , 另 一 个 线程 发 起 取消 操作 ,该 线程 也 不 一 定 马上 终止 ,只 能 在 可 取消 点 才能 终止 。 

可 以 设置 线程 为 立即 取消 或 只 能 在 取消 点 被 取消 。 

要 取消 一 个 线程 ,可 以 使 用 pthread_cancel 函数 。 与 取消 线程 相关 的 接口 规范 说 明 
如 表 8. 8 一 表 8. 11 所 示 。 


表 8.8  pthread cancel 函数 的 接口 规范 说 明 


函数 名 称 pthread_cancel 

函数 功能 取消 一 个 线程 

头 文件 # include «pthread. h> 

函数 原型 int pthread cancel(pthread t thread) ; 
参数 thread: 要 取消 的 线程 的 pid 

ns TO 
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3€ 8.9  pthread setcancelstate 函数 的 接口 规范 说 明 


函数 名 称 pthread setcancelstate 
函数 功能 设置 可 取消 状态 
头 文件 # include <pthread. h> 
函数 原型 int pthread_setcancelstate(int state, int * oldstate) ; 
参数 state: 设置 的 取消 状态 

oldstate: 保存 上 一 次 取消 状态 的 指针 

0: 
miia WES. AM 

3€ 8.10  pthread setcanceltype 函数 的 接口 规范 说 明 

函数 名 称 pthread setcanceltype 
函数 功能 设置 取消 类 型 
头 文件 # include — pthread. h> 
函数 原型 int pthread_setcanceltype(int type, int * oldtype) ; 
参数 type: 要 设置 的 取消 类 型 

oldtype: 指针 类 型 ,保存 上 一 次 取消 的 类 型 

0: 
iia Has. AM 
表 8.11  pthread testcancel 函数 的 说 明 

函数 名 称 pthread_testcancel 
函数 功能 za ERO Cancled 状态 ,如 果 是 , 则 进行 取消 动作 ,否则 直接 
头 文件 include —pthread. h> 
函数 原型 void pthread_testcancel( void) ; 
参数 无 
返回 值 无 


pthread cancel 函数 请 求 取消 执行 线程 , 仅 当 目标 线程 的 可 取消 状态 为 PTHREAD_ 
CANCEL ENABLE 时 , 才 可 进行 取消 。 

参数 State 的 合法 值 为 : 

。 PTHREAD_CANCEL_DISABLE, 针 对 目标 线程 的 取消 请 求 将 处 于 未 决 状态 。 
除非 该 线程 修改 自己 的 状态 ,否则 不 会 被 取消 。 
PTHREAD_CANCEL_ENABLE, 针 对 目标 线程 的 取消 请 求 将 被 传递 。 创 建 一 
个 线程 时 ,默认 状态 是 PTHREAD_CANCEL_ENABLE。 
参数 type 的 合法 值 为 : 

* PTHREAD CANCEL ASYNCHRONOUS. ,表示 线程 在 接 到 取消 请 求 后 立刻 执 
行 取消 操作 。 
* PTHREAD_CANCEL_DEFERRED ,表示 线程 在 接收 到 取消 请 求 后 ,一 直 等 待 直 


Ve/ usanne 


到 线程 执行 了 pthread_join, pthread_cond_wait, pthread_cond_timedwait, pthread _ 

testcancel,sem wait 或 sigwait 函数 中 的 其 中 一 个 才 执 行 取消 操作 。 在 创建 一 个 

线程 时 ,其 可 取消 的 类 型 设置 默认 状态 是 PTHREAD_CANCEL_DEFERRED。 
如 果 禁 用 了 线程 的 可 取消 状态 , 则 该 线程 的 可 取消 类 型 的 设置 不 会 立即 生效 ,所 有 取 


消 请 求 都 保留 为 未 决 状态 。 
线程 终止 如 示例 程序 8. 5 所 示 。 


[示例 程序 8.5 exp. cancel.c] 
# include< stdio.h» 

# include< pthread.h> 

# include< stdio.h> 
#include< errmo.h» 

# include< stdlib.h» 

# include< unistd.h> 


void * thread func(void * ignored argument) 


t 


int ret; 


ret-pthread setcancelstate(PTHREAD CANCEL DISABLE, NULL); 
if (ret !- 0) 
1 
printf ("pthread setcancelstate failed"); 
exit(1); 
) 
printf ("thread func(): started; cancellaticn disabled n"); 
sleep); 
printf ("thread func(): about to enable cancellationin"); 


ret-pthread setcanoelstate (PTHREAD CANCEL ENBBIE, NULL); 
if (ret !=0) 
t 
printf ("pthread setcancelstate failed\n"); 
exit (1); 
1 


sleep (1000) ; 
printf ("thread func(): not canceled!An") ; 
return NULL; 
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ret-pthread create(sthr, NULL, &thread func, NULL); 
if (ret !=0) 
t 
printf ("pthread create failed"); 
exit(1); 
} 


sleep(2); 


printf ("main () : sending cancellation regquest\n"); 
ret=pthread cancel (thr); 
if (ret !=0) 
t 
printf ("pthread cancel failedWn"); 
exit(1); 
} 


ret-pthread join(thr, &res); 
if (ret !- 0) 
i 
printf ("pthread cancel failed\n"); 
exit(1); 
I 


if (res== PTHREAD CANCEIED) 
printf ("main () : thread was canceled n") ; 
else 
printf("main(): thread wasn't canceled (shouldn't happen!)Wn") ; 
exit(EXIT SUXESS); 
) 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 
root@ubuntu:~ # ./exp cancel 
thread func(): started; cancellation disabled 
main(): sending cancellation request 
thread func(): about to enable cancellation 
main(): thread was canceled 
从 程序 运行 结果 可 以 看 出 : 当 一 个 禁止 取消 的 线程 , 收 到 一 个 取消 信号 时 ,此 信号 会 
被 放 和 未 决 队列 ,直到 该 线程 开启 取消 。 


824 线程 挂 起 


当 使 用 线程 执行 特定 的 处 理 时 ,可 能 需要 临时 性 地 停止 某 个 线程 的 处 理 , 稍 后 再 恢复 
该 线程 。 使 用 sleep 函数 ,可 以 在 特定 长 度 的 时 间 内 将 线程 的 执行 挂 起 。 与 线程 挂 起 相 
关 的 接口 规范 说 明 如 表 8. 12 一 表 8. 14 所 示 。 


表 8.12 sleep 函数 的 接口 规范 说 明 


函数 名 称 sleep 
函数 功能 睡眠 当前 线程 直到 超时 
头 文件 # include —unistd. h> 
函数 原型 unsigned int sleepCunsigned int seconds) ; 
参数 seconds; 要 睡眠 的 秒 数 
P 0: 成 功 
iim 0, 睡眠 时 被 另 一 个 信号 打 断 (返回 剩余 的 秒 数 ) 
表 8.13 usleep 函数 的 接口 规范 说 明 
函数 名 称 usleep 
函数 功能 睡眠 当前 线程 直到 超时 
头 文件 # include — unistd. h> 
函数 原型 int usleep(useconds_t usec); 
参数 usec: 挂 起 时 间 ,单位 是 微 秒 
" 0; 成 功 
am 一 1: 出 错 ,并 且 errno 被 设置 
表 8.14 nanosleep 函数 的 接口 规范 说 明 
函数 名 称 nanosleep 
函数 功能 睡眠 当前 线程 直到 超时 
头 文件 # include —time. h> 
函数 原型 int nanosleep(const struct timespec * req. struct timespec * rem); 
参数 req: 请 求 挂 起 的 时 间 
rem: 被 信号 打 断 后 的 剩余 时 间 
0; 成 功 
iion 一 1, 出 错 ,并 且 errno 被 设置 


示例 程序 8. 6 中 分 别 使 用 sleep 的 三 种 方式 实现 了 线程 睡眠 5 秒 。 


[示例 程序 8.6 exp. sleep.c] 
# include< stdio.h> 
# include< unistd.h» 
# include time.h» 


struct timespec tt= (5,100); 


int main (void) 


t 


printf "start! Wn") ; 
Sleep(5)7 


printf (end! Vn") ; 
printf ("start! Wn") 
for(int i-0;i« 10;i++) 
sleep (500000) ; 
printf (end! Vn") ; 
printf ("startAn") ; 


nanosleep(&tt,NULL) ; 
printf ("end! Wn") ; 


return 0; 
) 
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编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp sleep 


start 
end 
Start 
end 
start 
end 


825 线程 的 分 离 


在 任何 一 个 时 间 点 上 ,线程 是 可 结合 的 (joinable) ,或 者 是 分 离 的 (detached) 。 一 个 
可 结合 的 线程 能 够 被 其 他 线程 回收 其 资源 和 杀 死 ;在 被 其 他 线程 回收 资源 之 前 , 它 的 存储 
器 资源 是 不 释放 的 。 相 反 , 一 个 分 离 的 线程 是 不 能 被 其 他 线程 回收 或 杀 死 的 , 它 的 存储 器 


资源 在 它 终止 时 由 系统 自动 释放 。 


线程 的 分 离 状态 决定 一 个 线程 以 什么 样 的 方式 来 终止 自己 。 在 默认 情况 下 线程 是 非 
分 离 状 态 的 ,在 这 种 情况 下 , 原 有 的 线程 等 待 创建 的 线程 结束 。 只 有 当 pthread. join O FR 
数 返 回 时 ,创建 的 线程 才 算 终 止 ,才能 释放 已 占用 的 系统 资源 。 而 分 离线 程 如 果 没 有 被 其 
他 的 线程 所 等 待 , 当 该 线程 运行 结束 ,线程 就 终止 了 ,同时 也 会 立刻 释放 系统 资源 。 线 程 
分 离 使 用 pthread_detach() 实 现 ,该 接口 规范 说 明 如 表 8. 15 所 示 。 

表 8.15  pthread detach 函数 的 接口 规范 说 明 


函数 名 称 pthread_detach 

函数 功能 使 线程 处 于 分 离 状态 

头 文件 # include — pthread. h> 

函数 原型 int pthread_detach(pthread_t threadID) ; 
参数 threaID; 要 分 离 的 线程 id 

返回 值 ey 


错误 号 : 失败 
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线程 分 离 如 示例 程序 8. 7 所 示 。 


[示例 程序 8.7 exp detach.c] 
# include stdio.h» 

# include« pthread.h» 

# include« unistd.h» 


void* threadl (void * arg) 
{ 
while (1) 
t 
usleep(100 * 1000); 
printf ("threadl rumning...!\n"); 
) 
printf ("Leave threadl !\n"); 


retum NULL; 


int main (int argc, char** argv) 
{ 
pthread t tid; 


pthread create(&tid, NULL, (void* )threadl, NULL); 
pthread detach (tid); // 使 线程 处 于 分 离 状态 
sleep); 


printf ("Leave main thread!Wn") ; 
pthread exit (NULL); 
retum 0; 

) 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 
rootGubuntu:^ # ./exp sleep 

threadl running...! 
threadl running...! 
threadl running...! 
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程序 运行 结果 说 明 : pthread detach 函数 只 是 使 该 线程 结束 时 ,资源 由 系统 回收 ,而 
不 必 在 其 他 线程 中 调用 pthread join 函数 回收 。 


826 线程 的 一 次 性 初始 化 


1. 为 什么 要 进行 一 次 性 初始 化 

有 些 POSIX 变量 只 能 进行 一 次 初始 化 ,例如 互 斥 变量 ,如 果 进 行 多 次 初始 化 程序 就 
会 出 现 错误 。 

在 传统 的 顺序 编程 中 ,一 次 性 初始 化 通常 使 用 布尔 变量 来 管理 。 控 制 变量 被 静态 初 
始 化 为 0, 任何 依赖 于 初始 化 的 代码 都 能 测试 该 变量 。 如 果 变 量 值 仍然 为 0, 则 它 能 实行 
初始 化 ,然后 将 变量 置 为 1, 以 后 检查 的 代码 将 跳 过 初始 化 。 

但 是 在 多 线程 程序 设计 中 ,如 果 多 个 线程 并 发 地 执行 初始 化 序列 代码 ,可 能 有 两 个 线 
程 发 现 控制 变量 为 0, 并 且 都 实行 初始 化 ,而 该 过 程 本 该 仅仅 执行 一 次 。 

如 果 需 要 对 一 个 POSIX 变量 静态 的 初始 化 ,可 以 使 用 互 斥 量 对 该 变量 的 初始 化 进行 
控制 。 如 果 需 要 对 变量 进行 动态 初始 化 ,POSIX 提供 了 pthread once 函数 ,该 函数 能 实 
现 对 变量 的 一 次 性 动态 初始 化 ,其 详细 说 明 如 表 8. 16 所 示 。 

表 8.16 pthread_once 函数 的 接口 规范 说 明 
函数 名 称 pthread_once 


函数 功能 一 次 性 初始 化 
头 文件 # include <pthread. h> 
函数 原型 int pthread once(pthread once t * once control. void ( * init routine) (void) ) ; 
su once control, 决定 init_routine 函数 是 否 执行 
init routine: 初始 化 要 执行 的 函数 
0: 
EB | qao uw 


2. 如 何 进行 一 次 性 初始 化 
CD 首先 定义 一 个 pthread_once_t 类 型 的 变量 ,使 用 宏 PTHREAD ONCE INIT 对 
该 变量 初始 化 。 然 后 创建 一 个 与 控制 变量 相关 的 初始 化 函数 : 


pthread once t once control- PTHREAD ONCE INIT; 
void init routine() 
{ 

// 初 始 化 互 斥 量 

// 初 始 化 读 写 锁 


(2) 调用 pthread once 函数 。 该 函数 使 用 初 值 为 PTHREAD_ONCE_INIT 的 once_ 
control 变量 保证 init. routine 函数 在 同一 进程 执行 序列 中 仅 执行 一 次 。 在 多 线程 编程 环 
境 下 ,尽管 pthread_once 函数 调用 会 出 现在 多 个 线程 中 ,由 使 用 互 斥 锁 和 条 件 变量 保证 
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init routine 函数 仅 执行 一 次 。 
pthread once 的 执行 状态 有 三 种 : NEVER(0) 、IN_PROGRESS(1) 和 DONE (2) ,使 
用 once control 来 表示 pthread_once 的 执行 状态 : 
* 如 果 once control 初 值 为 0, 那么 pthread once 函数 从 未 执行 过 ,init_routine FR 
数 会 执行 。 
* 如 果 once control 初 值 设 为 1, 则 由 于 所 有 pthread_once 函数 都 必须 等 待 其 中 一 
个 线程 激发 “已 执行 一 次 ”信号 , 因此 所 有 pthread_once 函数 都 会 陷入 永久 的 等 
待 中 ,init_routine 函数 就 无 法 执行 。 
。 如 果 once_control 初 值 设 为 2, 则 表示 pthread_once 函数 已 执行 过 一 次 ,从 而 所 有 
pthread once 函数 都 会 立即 返回 ,init_routine 函数 就 没有 机 会 执行 ， 当 pthread_ 
once 因数 成 功 返 回 ,once_control 就 会 被 设置 为 2。 
在 示例 程序 8. 8 中 创建 的 两 个 子 线程 执行 同一 个 函数 对 全 局 变量 count 进行 初始 
化 ,给 count 加 1 后 打印 输出 。 


[示例 程序 8.8 exp_cnce.c] 
# include< stdio.h> 

# include< assert.h» 

# include< pthread.h> 

# include< unistd.h> 


static int count- 0; 
static pthread once t onoe- PTHREAD ONCE INIT; 
void thread init(){ 

count- 5; 


printf ("[Child $1d] init i ($d) Wn", pthread self(),count); 


void * theThread(void * param) 
t 
pthread onœ (sonce, &thread init); 
countt* ; 
printf ("[Child $1d] loop i ($d) \n",pthread self (),count) ; 
pthread exit (&count); 
return NULL; 


intmain(int argc,char* argv[]) 

{ 
pthread t tidl, tid2; 
pthread create(&tidl, NULL, &theThread, NULL); 
Sleep (3); 
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pthread create(&tid2, NULL, &theThread, NULL); 
void * status- NULL; 
int rc-pthread join(tidl, &status); 
assert (rc- — 0); 
if (status !- PTHREAD CANCEIED && status !- NULL) 
í 
printf ("Returned value fram threadl: d\n", * (int * )status); 


rc-pthread join(tid2, &status); 
assert (rc- - 0); 
if (status != PTHREAD CANCEIED && status !— NULL) 
t 
printf ("Returned value fram thread?: $dWn", * (int * )status); 
} 
retum 0; 
) 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 
rootGubuntu:^ # ./exp once 
[Child 139639258564352] init i (5) 
[Child 139639258564352] loop i (6) 
Returned value fram threadl: 6 


[Child 139639247980288] loop i (7) 
Returned value fram thread?: 7 


从 执行 结果 可 以 看 出 初始 化 函数 thread. init 函数 只 执行 了 一 次 。 
827 线程 的 私有 数据 


在 单线 程 程序 中 ,经 常 要 用 到 “全 局 变量 ”以 实现 多 个 函数 间 共 享 数据 。 在 多 线程 环 
境 下 ,由 于 数据 空间 是 共享 的 ,因此 全 局 变量 也 为 所 有 线程 所 共有 。 但 有 时 应 用 程序 设计 
中 有 必要 提供 线程 私有 的 全 局 变量 , 仅 在 某 个 线程 中 有 效 . 但 却 可 以 跨 多 个 函数 访问 , 例 
如 程序 可 能 需要 每 个 线程 维护 一 个 链表 ,而 使 用 相同 的 函数 操作 ,此 时 就 可 以 创建 线程 私 
有 数据 (Thread-Specific Data,TSD) 来 解决 。 

在 线程 内 部 ,私有 数据 可 以 被 线程 的 各 个 接口 访问 ,但 对 其 他 线程 屏蔽 。 线 程 和 有数 
据 采用 了 一 键 多 值 技术 , 即 一 个 key 对 应 多 个 值 。 访 问 数据 都 是 通过 键 值 来 访问 的 。 使 
用 线程 私有 数据 时 ,需要 对 每 个 线程 创建 一 个 关联 的 key, POSIX 中 操作 线程 私有 数据 通 
过 以 下 4 个 函数 来 实现 。 

1. 创建 一 个 键 

使 用 私有 数据 时 ,首先 需要 创建 一 个 私有 数据 键 ,可 通过 pthread_key_create 函数 实 
现 , 该 函数 的 接口 规范 说 明 如 表 8. 17 所 示 。 
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表 8.17 pthread_key_create 函数 的 接口 规范 说 明 


函数 名 称 pthread_key_create 
函数 功能 创建 一 个 对 同一 进程 内 所 有 线程 都 可 见 的 线程 私有 数据 键 
头 文件 # include — pthread. h> 
函数 原型 int pthread_key_create(pthread_key_t * key, void ( * destructor) (void * )) ; 
参数 key: 线程 私有 数据 键 
destructor; 线程 退出 时 调用 的 函数 
y 0: 成 功 
niis 错误 号 : 失败 
该 函数 执行 时 ,首先 从 Linux 的 TSD 池 中 分 配 一 项 ,然后 将 其 值 赋 给 key 供 以 后 访 


问 使 用 。 函 数 的 第 


一 个 参数 key 为 指向 键 值 的 指针 ,第 二 个 参数 为 一 个 函数 指针 ,如 果 指 


针 不 为 空 , 则 在 线程 退出 时 将 以 key 所 关联 的 数据 为 参数 调用 指针 destructor Jr it hY PR 
数 , 释 放 分 配 的 缓冲 区 。 无 论 哪个 线程 调用 pthread_key_create 函数 ,所 创建 的 key 都 是 


所 有 线程 可 访问 的 
供 了 一 个 同名 而 不 


,但 各 个 线程 可 根据 自己 的 需要 往 key 中 填 入 不 同 的 值 ,这 就 相当 于 提 
同 值 的 全 局 变量 , 即 一 键 多 值 。 


2. 设置 线程 私有 数据 
pthread setspecific 函数 为 指定 键 值 设置 线程 私有 数据 ,该 函数 的 接口 规范 说 明 如 


表 8. 18 所 示 。 


表 8.18  pthread setspecific 函数 的 接口 规范 说 明 


函数 名 称 pthread_setspecific 
函数 功能 为 指定 键 值 设置 线程 私有 数据 
头 文件 # include <pthread. h> 
函数 原型 int pthread_setspecific(pthread_key_t key, const void * value); 
参数 key; 线程 私有 数据 键 
value: 和 key 关联 起 来 的 数据 的 地 址 
ang WAS. AR 


该 函数 将 指针 value 的 值 ( 指 针 值 而 非 其 指向 的 内 容 ) 与 key 相关 联 。 使 用 pthread 
setspecific 函数 为 一 个 键 指定 新 的 线程 数据 时 ,线程 必须 释放 原 有 的 数据 用 以 回收 空间 。 

3. 读 取 线程 私有 数据 

pthread getspecific 函数 从 指定 键 值 读 取 线 程 私 有 数据 ,该 函数 的 接口 规范 说 明 如 


表 8.19 所 示 。 


表 8.19  pthread getspecific 函数 的 接口 规范 说 明 


函数 名 称 


pthread_getspecific 


函数 功能 


从 指定 键 读 取 线程 的 私有 数据 
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头 文件 £ include — pthread. h> 
函数 原型 void * pthread_getspecific(pthread_key_t key); 
参数 key: 需要 获取 数据 的 键 
" 0: 成 功 
FUR WRS: 失败 
4. 删除 一 个 键 


pthread key delete 函数 用 于 删除 线程 的 私有 数据 键 ,该 函数 的 接口 规范 说 明 如 


X 8. 20 所 示 。 


表 8. 20  pthread key delete 函数 的 接口 规范 说 明 


函数 名 称 pthread_key_delete 

函数 功能 删除 线程 私有 数据 键 

头 文件 £ include — pthread. h> 

函数 原型 int pthread key delete(pthread key t key); 
参数 key: 线程 私有 数据 键 

aaa WES. A 


注意 : pthread key delete 函数 并 不 检查 当前 是 否 有 线程 正 使 用 该 TSD, 也 不 会 调用 
清理 函数 (destr_function) ,而 只 是 将 TSD 释放 以 供 下 一 次 调用 pthread_key_create 函数 


使 用 ,如 示例 程序 8.9 所 示 。 


[示例 程序 8.9 exp. specific.c] 
# include< stdio.h> 
# include< pthread.h> 


pthread key t key; 


void echamsg (void * t) 
{ 
printf ("destructor executed int thread $u, parame $uWMn", 
pthread self(), (ünt * )t)); 


void * childl(void * arg) 
{ 

int i=10; 

int tid- pthread self(); 

printf ("\nset key value sd in thread $uW",i,tid); 
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pthread setspecific(key,&i); 
printf ("thread one sleep 2 until thread two finish"); 
Sleep (2); 
printf ("\nthread $u returns $d,add is Su\n", tid, 
* (Gnt * ) pthread getspecific (key)), 
(int * )pthread getspecific(key)); 


void * child?(void * arg) 


t 


int temp- 20; 
int tid- pthread self (); 
printf ("\nset key value &d in thread $u\n", temp, tid) ; 
pthread setspecific (key, &temp) ; 
printf ("thread one sleep 2 until thread two finish"); 
Sleep (1) 
printf ("\nthread $u returns $d,add is $u\n", tid, 

* (Gnt * ) pthread getspecific(key)), 

(int * )pthread getspecific(key)); 


int main (void) 


{ 


} 


pthread t tidl, tid2; 

pthread key create (&key, echomsg) ; 

pthread create (&tidl,NULL, (void * )childl,NULL); 
pthread create (&tid2,NULL, (void * )child2,NULL); 
pthread join (tidl, NULL); 

pthread join (tid2, NULL); 
pthread key delete (key) ; 

return 0; 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


rootQubuntu:^ # ./exp specific 

set key value 10 in thread 3112802048 
thread one sleep 2 until thread two finish 
set key value 20 in thread 3104409344 


thread one sleep 2 until thread two finish 
thread 3104409344 returns 20,addr is 3104407344 


destructor executed int thread 3104409344, param- 3104407344 


thread 3112802048 returns 10,addr is 3112800048 
destructor executed int thread 3112802048,param- 3112800048 
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从 运行 结果 来 看 ,各 线程 对 自己 的 私有 数据 操作 互 不 影响 ,也 就 是 说 ,虽然 全 局 变量 
同名 ,但 访问 的 内 存 空间 并 不 是 同一 个 。 


8.3 线程 属性 


每 个 POSIX 线程 由 一 个 相连 的 属性 对 象 来 表示 特性 。 线 程 的 属性 对 象 能 与 多 个 线 
程 相连 ,POSIX 具有 创建 .配置 和 删除 属性 对 象 的 函数 。 线 程 可 以 分 组 ,并 将 相同 属性 与 
组 中 所 有 成 员 相 连 。 当 属性 对 象 的 其 中 一 个 特性 改变 时 ,组 中 所 有 实体 将 会 具有 新 的 特 
性 。 线 程 属 性 类 型 用 pthread_attr_t 表示 ,pthread_attr_t 定义 在 文件 /usr/include/bits/ 
pthreadtypes. h 中 。 该 结构 体 的 定义 如 下 : 


typedef struct 

{ 
int detachstate; /人 线程 的 分 离 状态 
int schedpolicy; /人 线程 调度 策略 
structsched param schedparam; /人 线程 的 调度 参数 
int inheritsched; /人 线程 的 继承 性 
int soe; // 线 程 的 作用 域 
size t guardsize; /人 线程 栈 末尾 警戒 缓冲 区 大 小 
int stackadir set; // 线 程 的 栈 设置 
void* stackadir; /人 线程 栈 的 位 置 
size 七 stacksize; /人 线程 栈 的 大 小 

)pthread attr t; 

各 个 字段 的 含义 如 下 : 


。 detachstate: 表示 新 创建 的 线程 是 否 与 进程 中 其 他 的 线程 脱离 同步 。detachstate 
的 缺 省 值 为 PTHREAD_CREATE_JOINABLE 状态 ,这 个 属性 也 可 以 用 pthread 
_detach 函数 来 设置 。 如 果 将 detachstate iE Jy PTHREAD CREATE. DETACH 
状态 , 则 detachstate 不 能 再 恢复 到 PTHREAD_CREATE _JOINABLE 状态 。 
schedpolicy: 表示 新 线程 的 调度 策略 。 主 要 包括 SCHED_OTHRE( 正 常 , 非 实 
时 ),SCHED_RR( 实 时 ,时 间 片 轮转 法 ) 和 SCHED_FIFO( 实 时 ,先进 先 出 )3 种 ， 
缺 省 为 SCHED_OTHER ,后 两 种 调度 策略 仅 对 超级 用 户 有 效 。 

schedparam; 是 一 个 struct sched. param 结构 ,其 中 有 一 个 整 型 变量 的 成 员 sched 
_priority 表示 线程 的 运行 优先 级 。 这 个 参数 仅 当 调度 策略 为 实时 ( 即 SCHED_ 
RR 或 SCHED_FIFO) 时 才 有 效 , 缺 省 为 0。 

inheritsched: 有 两 种 值 可 供 选择 ,分 别 是 PTHREAD_EXPLICIT_SCHED 和 
PTHREAD_INHERIT_SCHED ,前 者 表示 新 线程 显 式 指定 调度 策略 和 调度 参数 
(Hl attr 中 的 值 ), 后 者 表示 继承 调用 者 线程 的 值 。 缺 省 为 PTHREAD |. 
EXPLICIT_SCHED。 
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。 scope: 表示 线程 间 竞 争 CPU 的 范围 ,也 就 是 线程 优先 级 的 范围 。POSIX 的 标准 
中 定义 了 两 个 值 . PTHREAD_SCOPE_SYSTEM 和 PTHREAD_ SCOPE _ 
PROCESS ,前 者 表示 与 系统 中 所 有 线程 一 起 竞争 CPU, 后 者 表示 仅 与 同 进程 中 
的 线程 竞争 CPU. 


guardsize: 警戒 堆栈 的 大 小 。 
stackaddr set; 线程 栈 的 设置 。 
stackaddr: 线程 栈 的 地 址 。 
stacksize: 线程 栈 的 大 小 。 


线程 的 属性 值 不 能 直接 设置 , 须 使 用 相关 函数 进行 操作 。Linux 提供 了 这 些 状态 的 
设置 和 获取 函数 ,下 面 分 别 进行 详细 介绍 。 


831 线程 属性 对 象 


1. 初始 化 /销毁 线程 

在 使 用 一 个 线程 属性 对 象 之 前 ,必须 对 其 进行 初始 化 ,可 以 使 用 pthread_attr_init PK 
数 完成 对 线程 属性 对 象 的 初始 化 ;在 使 用 完 一 个 线程 属性 对 象 后 ,必须 对 其 进行 销毁 ,可 
以 使 用 pthread_attr_destroy 函数 完成 对 属性 对 象 的 销毁 。 这 两 个 函数 的 接口 规范 说 明 


如 表 8. 21 所 示 。 


表 8.21 pthread_attr_init/pthread_attr_destroy 函数 的 接口 规范 说 明 


函数 名 称 pthread attr init/pthread attr destroy 
函数 功能 初始 化 线程 属性 /销毁 线程 属性 
头 文件 # include —pthread. h> 
int pthread attr init(pthread attr t * attr); 
函数 原型 int pthread attr destroy(pthread attr t * attr); 
参数 attr: 指向 线程 属性 对 象 的 指针 
y 0: 成 功 
maim 一 1: 失败 
2. 线程 的 继承 性 


函数 pthread_attr_getinheritsched 和 pthread attr setinheritsched 分 别 用 来 获取 和 
设置 线程 的 继承 性 ,这 两 个 函数 的 接口 规范 说 明 如 表 8. 22 所 示 o 


表 8.22  pthread attr getinheritsched/pthread attr setinheritsched 函数 的 接口 规范 说 明 


函数 名 称 


pthread attr getinheritsched/pthread attr setinheritsched 


函数 功能 


获得 /设置 线程 的 继承 性 


头 文件 


# include — pthread. h> 


函数 原型 


int pthread attr getinheritsched(const pthread attr t * attr,int * inheritsched) ; 
int pthread attr setinheritsched(pthread attr t * attr.intinheritsched) ; 
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续 表 
pn ar, 指向 线程 属性 对 象 的 指针 
inheritsched 指向 线程 继承 性 的 指针 或 线程 的 继承 性 
0; 成 功 
EHE 一 1; 失败 


继承 性 intinheritsched 取 值 可 以 是 : 
。 PTHREAD_INHERIT_SCHED: 表示 新 线程 将 继承 创建 线程 的 调度 策略 和 
参数 。 
* PTHREAD EXPLICIT SCHED: 表示 使 用 在 schedpolicy 和 schedparam 属性 中 
显 式 设置 的 调度 策略 和 参数 。 
如 果 要 显 式 设置 一 个 线程 的 调度 策略 或 参数 , 则 必须 在 设置 之 前 将 inheritsched JR 
性 设置 为 PTHREAD_EXPLICIT_SCHED。 
3. 线程 的 调度 
PRI pthread_attr_setschedpolicy 和 pthread_attr_getschedpolicy 分 别 用 来 设置 和 得 
到 线程 的 调度 策略 ,这 两 个 函数 的 接口 规范 说 明 如 表 8. 23 所 示 。 


表 8.23 pthread_attr_getschedpolicy/pthread_attr_setschedpolicy 函数 的 接口 规范 说 明 


函数 名 称 pthread attr getschedpolicy/pthread attr setschedpolicy 

函数 功能 获得 /设置 线程 的 调度 策略 

头 文件 # include <pthread. h> 

函数 原型 int pthread attr getschedpolicy(const pthread attr t * attryint * policy) ; 
int pthread attr setschedpolicy(pthread attr t * attryint policy); 

参数 attr: 指向 线程 属性 对 象 的 指针 
policy: 调度 策略 或 指向 调度 策略 的 指针 

i 0: 成 功 

— 一 1: 失败 

调度 策略 policy 的 取 值 可 以 是 : 


* SCHED_FIFO: 实时 任务 调度 策略 , 先 来 先 服务 。 一 旦 占用 CPU 则 一 直 运 行 , 直 
到 有 更 高 优先 级 任务 到 达 或 自愿 阻塞 自己 。 
SCHED_RR: 实时 任务 调度 策略 ,时 间 片 轮转 法 。 当 任务 的 时 间 片 用 完 ,系统 将 
重新 分 配 时间 片 ,并 置 于 就 绪 队 列 尾 。 放 在 队列 的 末尾 保证 了 所 有 具有 相同 优先 
级 的 RR 任务 的 调度 公平 。 
SCHED OTHER: 非 实时 任务 调度 策略 ,一 旦 占用 CPU, 则 一 直 运行 ,直到 任务 
完成 。 

4. 线程 的 调度 参数 

PRÉC pthread_attr_getschedparam 和 pthread_attr_setschedparam 分 别 用 来 设置 和 
得 到 线程 的 调度 参数 ,这 两 个 函数 的 接口 规范 说 明 如 表 8. 24 所 示 。 
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表 8.24  pthread attr getschedparam/pthread attr setschedparam 函数 的 接口 规范 说 明 


函数 名 称 | pthread_attr_getschedparam/pthread_attr_setschedparam 


函数 功能 | 获得 /设置 线程 的 调度 参数 


头 文件 # include <pthread. h> 


函数 原型 int pthread_attr_getschedparam(const pthread attr t * attr, struct sched param * param); 


int pthread attr setschedparam(pthread attr t * attr.conststruct sched param * param); 


attr: 指向 线程 属性 对 象 的 指针 


参数 param: sched_param 结构 或 指向 该 结构 的 指针 
0: 成 功 
BE (ook, 


结构 体 sched_param 定义 在 文件 /usr/include/bits/sched. h 中 ,该 结构 体 定义 如 下 : 


struct sched param 
{ 
int sched priority; 
k 
其 中 sched_priority 是 一 个 优先 权 值 ,数值 越 大 优先 权 越 高 。 系 统 支 持 的 最 大 和 最 小 
优先 权 值 可 以 分 别 使 用 sched. get priority max 函数 和 sched. get priority min 函数 
获得 。 


832 设置 /获取 线程 detachstate 属性 


线程 的 分 离 状 态 决 定 一 个 线程 以 什么 样 的 方式 来 终止 自己 。 在 默认 情况 下 线程 是 非 
分 离 状 态 的 ,这 种 情况 下 , 原 有 的 线程 等 待 创 建 的 线程 结束 。 只 有 当 pthread_join 函数 返 
回 时 ,创建 的 线程 才 算 终止 ,才能 释放 自己 占用 的 系统 资源 。 对 于 分 离线 程 ,如 果 没 有 被 
其 他 的 线程 等 待 , 当 它 运行 结束 了 ,线程 也 就 终止 了 ,马上 释放 系统 资源 。 如 果 在 创建 线 
程 时 就 知道 不 需要 了 解 线程 的 终止 状态 , 则 可 以 设置 pthread_attr_t 结构 中 的 
detachstate 线程 属性 ,让 线程 以 分 离 状 态 启 动 。 

POSIX 提供 了 pthread_attr_setdetachstate 和 pthread_attr_getdetachstate 这 两 个 也 
数 用 于 对 detachstate 属性 进行 操作 ,这 两 个 函数 的 接口 规范 说 明 如 表 8. 25 所 示 。 


表 8.25 pthread_attr_setdetachstate/pthread_attr_getdetachstate 函数 的 接口 规范 说 明 


函数 名 称 pthread attr setdetachstate/pthread attr getdetachstate 


函数 功能 获取 /修改 线程 的 分 离 状态 属性 


头 文件 # include — pthread. h> 


int pthread attr setdetachstate(pthread attr t * attr,int detachstate) ; 
int pthread attr getdetachstate(const pthread attr t * attr,int * detachstate); 


函数 原型 
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续 表 
aur, 指向 线程 属性 对 象 的 指针 
detachstate 线程 的 分 离 状 态 属性 或 指向 线程 分 离 状 态 的 指针 
0: 成 功 
minis! 一 1; 失败 


pthread_attr_setdetachstate 系统 调用 用 于 设置 已 经 初始 化 的 属性 对 象 attr 中 的 参 
数 detachstate 属性 。detachstate 的 合法 值 包括 : 

* PTHREAD_CREATE_DETACHED, 以 分 离 状态 启动 线程 ,使 得 使 用 attr 创建 
的 线程 处 于 分 离 状 态 。 线 程 终止 时 ,系统 将 自动 回收 与 带 有 此 状态 的 线程 相关 联 
的 资源 ,这 类 线程 不 能 被 其 他 线程 等 待 。 

* PTHREAD_ CREATE_JOINABLE, 正 常 启动 线程 ,使 得 使 用 attr 创建 的 线程 处 于 可 
连接 状态 。 线 程 终止 时 ,不 会 回收 与 带 有 此 状态 的 线程 相关 联 的 资源 。 如 果 要 回收 
系统 , 则 应 用 程序 必须 在 其 他 线程 调用 pthread_detach 函数 或 pthread join 函数 。 

detachstate 的 默认 值 是 PTHREAD_CREATE_JOINABLE。 


833 设置 与 获取 线程 栈 相关 属性 


线程 包含 了 表示 进程 内 执行 环境 必需 的 信息 ,其 中 包括 进程 中 标识 线程 的 ID、 一 组 寄 
存 器 值 . 栈 .调度 优先 级 与 策略 .信号 屏蔽 字 errno 变量 以 及 线程 私有 数据 。 在 有 大 数据 量 
处 理 的 应 用 中 ,就 需要 在 栈 空间 分 配 一 个 大 的 内 存 块 ,但 是 线程 栈 空间 的 最 大 值 在 线程 创建 
的 时 候 就 已 经 确定 ,如 果 栈 的 大 小 超过 了 该 值 ,系统 将 访问 未 授权 的 内 存 块 。 这 时 可 通过 修 
改线 程 的 栈 空间 大 小 来 改变 ,POSIX 提供 了 4 个 函数 用 于 设置 和 获取 线程 栈 的 相关 属性 。 

1. 获取 线程 堆栈 大 小 

pthread attr getstacksize 函数 用 于 获取 线程 堆栈 大 小 ,该 函数 的 接口 规范 说 明 如 
表 8.26 所 示 。 


表 8.26  pthread attr getstacksize 函数 的 接口 规范 说 明 


函数 名 称 pthread_attr_getstacksize 
函数 功能 获取 线程 堆栈 大 小 
头 文件 £ include — pthread. h> 
函数 原型 int pthread attr getstacksize(const pthread attr t * attr, size t * stacksize) ; 
参数 attr; 指向 线程 属性 对 象 的 指针 
stacksize: 线程 的 堆栈 大 小 ,一 般 是 页 大 小 的 整数 倍 
a MR. AN 


2. 设置 线程 堆栈 大 小 
pthread attr setstacksize 函数 用 于 设置 线程 堆栈 大 小 ,该 函数 的 接口 规范 说 明 如 
表 8. 27 所 示 。 


表 8.27  pthread attr setstacksize 函数 的 接口 规范 说 明 


函数 名 称 pthread_attr_setstacksize 
函数 功能 设置 线程 堆栈 大 小 
头 文件 # include <pthread. h> 
函数 原型 int pthread attr setstacksize( pthread attr t * attr, size t stacksize) ; 
参数 attr: 指向 线程 属性 对 象 的 指针 
stacksize: 线程 的 栈 保护 区 大 小 
3 0; 成 功 
a HRS. 失败 
stacksize 的 合法 值 包括 : 


* PTHREAD STACK MIN: 该 选项 指定 使 用 此 属性 对 象 创建 的 线程 用 户 栈 大 小 
将 使 用 默认 堆栈 大 小 ,此 值 是 某 个 线程 所 需 的 最 小 堆栈 大 小 。 
* 具体 的 大 小 值 : 定义 使 用 线程 的 用 户 堆栈 大 小 的 数值 ,该 值 必须 大 于 等 于 
PTHREAD STACK MIN, 
3. 获取 线程 堆栈 地 址 
pthread attr getstackaddr 函数 用 于 获取 线程 堆栈 地 址 ,该 函数 的 接口 规范 说 明 如 
X 8. 28 WDR. 


表 8.28  pthread attr getstackaddr 函数 的 接口 规范 说 明 


函数 名 称 pthread_attr_getstackaddr 

函数 功能 获取 线程 堆栈 地 址 

头 文件 include 一 pthread. h> 

函数 原型 int pthread attr getstackaddr(pthread attr t * attr, void **stackaddr) ; 


attr: 指向 线程 属性 对 象 的 指针 


参数 stackaddr: 指向 堆栈 的 指针 ,用 于 存储 返回 获取 的 栈 地 址 
， 0; 成 功 
ERA 错误 号 ; 失败 


4. 设置 线程 堆栈 地 址 
pthread attr setstackaddr 函数 用 于 设置 线程 堆栈 地 址 ,该 函数 的 接口 规范 说 明 如 
表 8.29 所 示 。 
表 8.29  pthread attr setstackaddr 函数 的 接口 规范 说 明 


函数 名 称 pthread_attr_setstackaddr 

函数 功能 设置 线程 堆栈 地 址 

头 文件 #include <pthread. h> 

函数 原型 int pthread attr setstackaddr(pthread attr t * attr, void * stackaddr); 
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续 表 
aur: 指向 线程 属性 对 象 的 指针 
stackaddr: 指向 堆栈 的 指针 ,表示 设置 的 线程 堆栈 地 址 
0, 成 功 
EHE 错误 号 : 失败 


设置 与 获取 线程 属性 如 示例 程序 8. 9 所 示 。 


[示例 程序 8.9 exp attr.c] 

# define GNU SOURCE // 为 了 获取 pthread getattr no() 函数 声明 
# include< pthread.h> 

# include< stdio.h> 

# include< stdlib.h> 

# include< unistd.h» 

#include< ermo.h> 


# define handle error en(en, msg) V 
do ( errno-en; perror(msg); exit(EXIT FAILURE); ) while (0) 


static void display pthread attr (pthread attr t * attr, char * prefix) 
t 

ints, i; 

size tv; 

void * stkaddr; 

struct sched param sp; 


s-pthread attr getdetachstate(attr, &i); 


if (s !-0) 
handle error en(s, "pthread attr getdetachstate"); 
printf ("$sDetach state =$%s\n", prefix, \ 


(i== PTHREAD CREATE DETACHED) ? "PTHREAD CREATE DETACHED" : V 
= PIHREAD CREATE JOINABIE) ? "PTHREAD CREATE JOINAHIE" : \ 


"re 


s-pthread attr getscope (attr, &i); 


if (s !=0) 
handle error en(s, "pthread attr_getsoope"); 
printf ("%sSoope =%s\n", prefix,  \ 


(i== PTHREAD SOOPE SYSTEM) ? "PIHRERD SOOPE SYSTEM" : V 
(i== PTHREAD SOOPE PROCESS) ? "PTHREAD SOOPE PROCESS" : V 


"2?); 


s-pthreed attr getinheritsched(attr, &i); 
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if (st-0) 
handle error en(s, "pthread attr getinheritsched"); 
printf ("5sIrherit scheduler- %s\n", prefix, N 
(i== PTHREAD INHERIT SCHED)? "PTHRERD INHERIT SCHED": V 
(i== PTHREAD EXPLICIT SCHED) ? "PTHFEAD EXPLICIT SCHED" : 


"27?7); 

s-pthread attr getschedpolicy(attr, &i); 

if (s!-0) 

handle error en(s, "pthread attr getschedpolicy"); 
printf ("5sScheduling policy- $5Wn"', prefix, \ 
i-— SCHED OTHER)? "SCHED OTHER" : N 

(i== SCHED FIFO)? "SCHED FIFO" : N 
(i==SCHED RR)? "SCHED RR" : N 
"229; 


s-pthread attr getschedparam(attr, &sp); 
if (s!=0) 
handle error en(s, "pthread attr getschedparam"); 
printf ("&sScheduling priority =%d\n", prefix, sp.sched priority); 


s-pthread attr getguardsize(attr, &v); 
if (s!-0) 

handle error en(s, "pthread attr getguardsize"); 
printf("$s Guard size — $d bytes Wn", prefix, v); 


s-pthread attr getstack(attr, &stkaddr, &v); 
if (s!-0) 

handle error en(s, "pthread attr getstack"); 
printf ("$sStack address- $pWn", prefix, stkaddr); 
printf("$sStack size- 0x$zx bytes Wn", prefix, v); 


static void * thread start(void * arg) 


{ 


int s; 
pthread attr t gattr; 


s-pthread getattr np(pthread self(), &gattr); 
if (st=0) 
handle error en(s, "pthread getattr np"); 


printf ("Thread attributes: Wn") ; 
display pthread attr(&gattr, "Vt"); 


Y 


exit(EXIT SUCCESS); ERNA AUR 


int main (int argc, char * argv[]) 


t 


pthread t thr; 

pthread attr t attr; 
pthread attr t * attrp; 
int s; 


attrp- NULL; 


if (argc » 1) { 


int stack size; 


void * sp; 


attrp- &attr; 


s-pthread attr init(&attr); 
if (s!-0) 
handle error en(s, "pthread attr init"); 


s-pthread attr setdetachstate(sattr, PTHREAD CREATE DETACHED); 
if (s!-0) 
handle error en(s, "pthread attr setdetachstate"); 


s-pthread attr setinheritsched(&attr, PTHREAD EXPLICIT SCHED); 
if (s!-0) 
handle error en(s, "pthread attr setinheritsched"); 


stack size = strtoul (argv[1], NULL, 0); 
s= FOSIX memalign(&sp, sysconf( SC PAGESIZE), stack size); 
if (s!=0) 

handle error en(s, "FOSIX memalign"); 
printf ("POSIX memalign() allocated at $pWn", sp); 
s-pthread attr setstack(sattr, sp, stack size); 


if (s!-0) 
handle error en(s, "pthread attr setstack"); 
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} 


s=pthread create(&thr, attrp, &thread start, NULL); 
if (s!- 0) 
handle error en(s, "pthread create"); 


if (attrpl- NULL) ( 
s-pthread attr destroy (attrp); 
if (s!=0) 
handle error en(s, "pthread attr destroy"); 
} 
pause(); // 当 其 他 线程 调用 exico 时 结束 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp attr 


Thread attributes: 
Detach state = PIHREAD CREATE JOINABLE 
Soge =PIHREAD SOOFE SYSTEM 
Inherit scheduler = PTHREAD INHERIT SCHED 
Scheduling policy = SCHED OTHER 
Scheduling priority =0 
Guard size =4096 bytes 
Stack address = 0x7f8c57ad4000 
Stack size = 0x801000 bytes 

再 次 运行 : 


root@ubuntu:~ # ./exp attr 0x300000 
FOSIX memalign() allocated at 0x7fa6f307e000 


Thread attributes: 
Detach state = PIHREAD CREATE DETACHED 
Soxe = PIHREAD SOOPE SYSTEM 
Inherit scheduler = PIHREAD EXPLICIT SCHED 
Scheduling policy = SCHED OTHER 
Scheduling priority ^ =0 
Guard size =0 bytes 
Stack address = Ox 7fa6£307e000 
Stack size = 0300000 bytes 


运行 结果 表明 该 程序 成 功 地 修改 了 线程 栈 的 大 小 。 


8.4 线程 应 用 举例 


示例 程序 8. 10 用 来 动态 统计 输入 的 字符 个 数 。 


[示例 程序 8.10 ep_count.c] 
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# include stdio.h> 

# include« pthread.h> 
# includec unistd.h> 
# includec string.h> 


Char text [4096]= {0}; 
int flag-0; 
void * mythread(void * arg) 
{ 
intv- * (int * ) arg; 
while(1) 
t 
if(flag-- 1) 
t 
printf ("current length of text is : $dWn",strlen(text)); 
flag-0; 
) 
usleep (10000) ; 


int main() 

t 
int i-5; 
pthread t tid; 
char buf [128]; 


pthread create (&tid, NULL, mythread, &i) ; 


while(1) 

t 
memset (buf, 0, sizeof (buf) ) ; 
gets (buf) ; 
A printf (Wn n") ; 
strcat (text, buf) ; 
flag-1; 

) 

retum 0; 


3 


程序 首先 创建 了 一 个 线程 ,不 断 统计 公共 缓冲 区 的 字符 个 数 并 输出 。 主 线程 接收 用 
户 输入 。 当 主线 程 依次 输入 完成 后 ,修改 flag, 子 线程 得 以 打印 出 已 输入 的 字符 总 个 数 。 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


示例 程序 8. 11 首先 初始 化 了 一 个 活动 线程 数 为 3 的 线程 池 , 然 后 向 其 中 添加 了 10 
个 任务 。 等 待 这 三 个 线程 将 这 10 个 任务 执行 完成 后 ,销毁 线程 池 。 


[示例 程序 8.11 exp. attr.c] 
# include stdio.h> 

# includec stdlib.h> 

# include< unistd.h» 

# include< sys/types.h» 

# include< pthread.h> 

# include< assert.h» 


typedef struct worker 

t 
void * (* process) (void * arg); 
void * arg; 
struct worker * next; 

} CIhread worker; 


/做 程 池 结 构 

typedef struct 

{ 
pthread mutex t queue lock; 
pthread cond t queue ready; 
CThread worker * queue head; 
int shutdown; 
pthread t * threadid; 
int max thread num; 
int cur queue size; 

) CIhread pool; 


// 回 调 函 数 , 任 务 运行 时 会 调用 此 函数 
// 回 调 函 数 的 参数 


/链表 结构 ,线程 池 中 所 有 等 待 任务 


/ 懂 程 池 中 人 允许 的 活动 线程 数目 


// 当 前 等 待 队 列 的 任务 数目 


int pool add worker (void * (* process) (void * arg), void * arg); 


void * thread routine(void * arg); 


static CIhread pool * pool- NULL; 
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void pool init (int max thread num) 


t 


pool- (CIhread pool * ) malloc (sizeof (CIhread pool)); 


pthread mutex init(&(pool-» queue lock), NULL); 
pthread cond init(&(pool-» queue ready), NULL); 


pool-» queue head- NULL; 


pool-»max thread num-max thread num; 
pool-» cur queue size-0; 


pool- > shutdown- 0; 


pool-» threadid- (pthread t * ) malloc (mex thread num 
* sizeof(pthread t); 
int i-0; 
for (i=0; i«mex thread num; i++) 
t 
pthread create (&(pool- > threadid[i]), NULL, thread routine,NULL); 


// 向 线程 池 中 加 入 任务 
int pool add worker (void * (* process) (void * arg), void * arg) 


{ 


/构造 一 个 新 任务 
CThread worker * newworker- (CIhread worker * ) malloc 
(sizeof (CThread worker)); 


pthread mitex lock (&(pool- > queue lock)); 


CThread worker * menber-pool- > queue head; 
if (member!- NULL) 
{ 
while (menber- > next! NULL) 
menber- member- > next; 
menber- > next— neworker; 
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pool- > queue head- newworker; 


assert (pool- > queue head!- NULL) ; 


pool-»cur queue sizet ; 
pthread mutex unlock(&(pool- > queue lock)); 
pthread cond signal(&(pool- > queue ready)); 
return 0; 


// 销 毁 线程 池 
int pool destroy() 


/ 响 醒 所 有 等 待 线程 
pthread cond broadcast (& (pool- > queue ready)); 


// 阻 塞 等 待 线程 退出 

inti; 

for (i=0; i«pool-»mex thread num; i++) 
pthread join(pool- > threadid[i], NULL); 

free (pool- > threadid) ; 


// 销 毁 等 待 队列 
CIhread worker * head- NULL; 
while (pool- > queue head!- NULL) 
i 
head= pool- > queue head; 
pool- > queue head= pool- > queue head- > next; 
free (head) ; 
} 
// 销 毁 条 件 变 量 和 互 斥 量 
pthread mutex destroy(& (pool- > queue lock)); 
pthread cond destroy (&(pool- > queue ready)); 


free (pool); 


pool- NULL; 
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retum 0; 


void * thread routine (void * arg) 
( 
printf ("starting thread Ox&x Wn", pthread self()); 
while (1) 
( 
pthread mutex lock(&(pool- > queue lock)); 


while (pool-» cur queue size-- 0 && !pool- > shutdown) 

t 
printf ("thread Ox$x is waiting in", pthread self()); 
pthread cond wait(&(pool- > queue ready), &(pool- > queue lock)); 


if (pool- > shutdown) 
( 
pthread mitex unlock(s(pool- > queue lock)); 
printf ("thread Ox$x will exit n", pthread self ()); 
pthread exit (NULL) ; 


printf ("thread Ox%x is starting to work Wn", pthread self()); 


assert(pool- > cur queue size!- 0); 
assert (pool- > queue head!- NULL) ; 


pool-» cur queue size--; 

CThread worker * worker-pool- > queue head; 
pool-» queue head worker- > next; 

pthread mutex unlock(&(pool- > queue lock); 


(* (worker-» process)) (worker- > arg); 
free (worker) ; 
worker- NULL; 

) 

pthread exit (NULL); 


void * myprocess (void * arg) 
t 
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printf ("threadid is 0x%x, working on task $d\n", 


* (int * ) arg); 
sleep(1); 
retum NULL; 


int main(int argc, char * * argv) 
{ 
pool init); 


// 连 续 向 池 中 投入 10 个 任务 


pthread self(), 


int * workingnum- (int * ) malloc(sizeof (int) * 10); 


inti; 
for (i0; i«10; i++) 
{ 

workingnun[i]- i; 


pool add worker (myprocess, &workingnum[i]); 


sleep(5); 
// 销 毁 线程 池 
pool destroy(); 
free (workingnum) ; 
return 0; 

) 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp attr 
starting thread Oxc82cc700 

thread 0xc82cc700 is starting to work 
threadid is Oxc82cc700, working on task 0 
starting thread Oxc72ca700 

thread Oxc72ca700 is starting to work 
threadid is Qxc72ca700, working on task 1 
starting thread Oxc7acb700 

thread Oxc7ado700 is starting to work 
threadid is Qxc7adb700, working on task 2 
thread 0xc82cc700 is starting to work 
threadid is Qxc82cc700, working on task 3 
thread 0xc72ca700 is starting to work 
threadid is 0xc72ca700, working on task 4 
thread 0xc7ad5700 is starting to work 
threadid is Oxc7adb700, working on task 5 
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thread 0xc82cc700 is starting to work 
threadid is Oxc82cc700, working on task 6 
thread 0xc72ca700 is starting to work 
threadid is Oxc72ca700, working on task 7 
thread Oxc7ado700 is starting to work 
threadid is Oxc7acdb700, working on task 8 
thread 0xc82cc700 is starting to work 
threadid is 0xc82cc700, working on task 9 
thread 0xc72ca700 is waiting 

thread Oxc7ad700 is waiting 

thread 0xc82cc700 is waiting 

thread 0xc72ca700 will exit 

thread 0xc7acb700 will exit 

thread Oxc82cc700 will exit 


8.5 小 2 


使 用 线程 明显 的 好 处 之 一 是 提高 了 应 用 程序 的 响应 速度 ,线程 主要 用 于 需要 同时 进 
行 多 个 服务 的 程序 中 。 线 程 同 进程 一 样 ,具有 创建 、 退 出、 取消 和 等 待 等 基本 操作 ,可 以 独 
立 完成 特定 事务 的 处 理 。 本 章 主 要 介绍 了 线程 基本 概念 ,线程 系统 调用 的 使 用 方法 及 线 
程 属性 的 相关 知识 。 完 整地 理解 Linux 线程 操作 非常 重要 ,读者 需要 对 线程 函数 的 使 用 


习 题 

一 、 填空 题 

1. 在 POSIX 中 ,线程 是 使 用 函数 创建 的 ,如 果 需 要 结束 一 个 线程 ,需要 调 
用 函数 。 

2. 线程 可 以 分 为 态 线程 和 态 线程 。 其中， 态 线 程 又 称 为 
轻 量 级 进程 。 

3. 如 果 线 程 可 以 在 进程 执行 期 间 的 任意 时 刻 被 创建 ,并 且 不 需要 事先 指定 线程 的 数 
量 , 这 样 的 线程 被 称 为 线程 。 

4. 引入 线程 这 一 概念 之 后 ， 是 分 配 资源 的 基本 单位 ， 是 进行 调度 
的 基本 单位 。 

5 同一 进程 中 的 多 个 线程 共享 进程 的 和 

6. 每 个 POSIX 线程 有 一 个 相连 的 来 表示 特性 。 

二 、 简 答题 


1. 多 线程 与 多 进程 相 比 有 哪些 优势 ? 
2. 线程 有 哪些 结束 的 方式 ? 请 简单 说 明 。 
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三 、 编程 题 

1. 编写 一 个 多 线程 多 进程 的 程序 ,要 求 创建 3 个 子 进程 ,每 个 子 进程 都 分 别 创建 2 
个 线程 ,进程 和 线程 的 功能 不 做 要 求 ,可 只 提供 简单 的 功能 。 

2. 编写 一 个 程序 ,在 主线 程 中 创建 一 个 新 线程 ,在 主线 程 中 得 到 新 线程 的 各 个 属性 ， 
并 在 主线 程 中 将 它们 打印 输出 。 

3. 使 用 多 线程 编写 矩阵 乘法 程序 。 

CD 给 定 两 个 矩阵 A 和 B, 其 中 和 矩阵 A 为 m 行 .k 列 ,B 为 k 行 .n 列 ,A 和 B 的 矩阵 
乘积 为 C,C 为 m 行 n 列 。 

(2) 对 于 该 程序 ,计算 每 个 Gi; 是 一 个 独立 的 工作 线程 ,即使 用 MXN 个 工作 线程 


完成 。 


P rad eh 


EM 


线程 间 的 同步 机 制 


线程 特点 之 一 就 是 实现 了 资源 的 共享 性 ,资源 共享 中 的 同步 问题 是 多 线程 编程 的 
重点 及 难点 。Linux 操作 系统 提供 了 多 种 方式 处 理 线程 间 的 同步 问题 ,其 中 最 常用 的 
有 互 斥 锁 、 条 件 变量 读 写 锁 和 异步 信号 等 方式 。 本 章 重点 介绍 这 4 种 同步 技术 及 其 
应 用 。 


9.1 E R 锁 


911 互 斥 锁 基 本 原理 


顾名思义 , 互 斥 锁 提供 了 对 临界 资源 以 互 太 方式 进行 访问 的 同步 机 制 , 即 以 排他 的 方 
式 防 止 临界 资源 被 破坏 。 

简单 来 说 互 斥 锁 类 似 于 一 个 布尔 变量 , 它 只 有 ”锁定 ”和 * 打 开 ? 两 种 状态 ,在 使 用 临界 
资源 时 线程 先 申 请 互 斥 锁 , 如 果 此 时 互 斥 锁 处 于 “打开 ”状态 , 则 立刻 占有 该 锁 , 将 状态 置 
为 “锁定 ”"。 此 时 如 果 再 有 其 他 线程 使 用 该 临界 资源 时 发 现 互 斥 锁 处 于 “锁定 ”状态 , 则 阻 
塞 该 线程 ,直到 持 有 该 互 斥 锁 的 线程 释放 该 锁 。 通 过 这 样 的 机 制 保证 在 使 用 临界 资源 时 
数据 不 会 被 男 一 个 线程 破坏 。 
912 互 斥 锁 基本 操作 

1. 互 斥 锁 的 初始 化 

在 使 用 互 斥 锁 之 前 需要 对 其 进行 初始 化 ,因为 互 斥 锁 是 在 多 个 线程 之 间 保 证 共享 
资源 的 正确 性 ,所 以 初始 化 的 互 斥 锁 是 一 个 全 局 变量 (保证 在 多 个 线程 之 间 是 同一 把 
锁 ) ,pthread_mutex_init 函数 用 于 初始 化 互 斥 锁 , 该 函数 的 接口 规范 说 明 如 表 9. 1 
所 示 。 

表 9.1 pthread_mutex_init 函数 的 接口 规范 说 明 

函数 名 称 pthread_mutex_init 

函数 功能 初始 化 互 斥 锁 

头 文件 # include —pthread. h> 


int pthread mutex init(pthread mutex t * restrict mutex, const pthread mutexattr 


函数 原型 


_t * restrict attr) ; 
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续 表 
"- restrict, EXER HER US EE 
attr: 指向 描述 互 斥 锁 属 性 的 指针 
0; 成 功 
aiia 非 0, 失败 


说 明 : pthread mutex init 函数 第 二 个 参数 attr 是 指向 描述 互 斥 锁 属 性 的 指针 ,如 果 
该 参数 为 NULL 则 表示 使 用 默认 属性 , 互 斥 锁 的 属性 值 及 含义 如 表 9. 2 所 示 。 


R92 互 斥 锁 属性 
属 性 含 X 
PTHREAD MUTEX_ P " 
TIMED NP 普通 锁 , 当 一 个 线程 加 锁 后 ,其 他 线程 无 法 获得 锁 ,并 形成 等 待 队列 
PTHREAD_MUTEX_ | 嵌 套 锁 , 允 许 一 个 线程 对 同一 个 锁 多 次 加 锁 , 并 通过 unlock 解锁 。 如 果 是 
RECURSIVE_NP 不 同 线程 的 请 求 , 则 在 解锁 时 重新 竞争 


PTHREAD MUTEX | 检 错 锁 , 在 同一 线程 请 求 同 一 锁 时 返回 EDEADLK ,否则 执行 的 动作 与 类 型 
ERRORCHECK NP | PTHREAD_MUTEX_TIMED_NP 相同 

PTHREAD MUTEX 
ADAPTIVE. NP 


适应 锁 , 释 放 后 重新 竞争 


2. 互 斥 锁 的 销毁 

互 斥 锁 在 系统 中 也 占有 一 定 的 资源 ,因此 当 一 个 互 斥 锁 已 经 使 用 完成 ,就 需要 对 它 进 
行销 毁 操作 , pthread_mutex_destroy 函数 用 于 销毁 互 斥 锁 ,该 函数 的 接口 规范 说 明 如 
X 9.3 所 示 。 


表 9.3  pthread mutex destroy 函数 的 接口 规范 说 明 


函数 名 称 pthread mutex destroy 
函数 功能 销毁 互 斥 锁 
头 文件 £ include <pthread. h> 
函数 原型 int pthread mutex destroy(pthread mutex t * mutex); 
参数 mutex; 需要 销毁 的 互 斥 锁 对 象 的 指针 
0: 成 功 
dam do. 失败 
3. 申请 互 斥 锁 


在 需要 使 用 临界 资源 时 需要 先 申请 锁 ,保证 当前 线程 抢 到 锁 以 后 再 对 临界 资源 进行 
操作 ,pthread_mutex_lock 函数 用 于 申请 锁 , 该 函数 的 接口 规范 说 明 如 表 9.4 所 示 。 


表 9.4 pthread_mutex_lock 函数 的 接口 规范 说 明 


函数 名 称 pthread mutex lock 
函数 功能 申请 互 斥 锁 
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续 表 
头 文件 # include <pthread. h> 
函数 原型 int pthread mutex lock(pthread mutex t * mutex); 
参数 mutex: 指向 互 斥 锁 对 象 的 指针 
0; 成 功 
ua 非 0: 失败 


使 用 该 函数 加 锁 时 ,如 果 mutex 已 经 被 锁 住 ,当前 尝试 加 锁 的 线程 就 会 被 阻塞 ,直到 
互 斥 锁 被 其 他 线程 释放 ,申请 到 锁 为 止 。 

在 有 些 场景 下 希望 线程 在 没有 申请 到 锁 的 时 候 立 即 返回 ,POSIX 提供 了 pthread |. 
mutex trylock 天 数 实现 ,该 函数 的 接口 规范 说 明 如 表 9. 5 所 示 。 


表 9.5 pthread mutex trylock 函数 的 接口 规范 说 明 


函数 名 称 pthread mutex trylock 

函数 功能 申请 互 斥 锁 

头 文件 # include — pthread. h> 

函数 原型 int pthread_mutex_ trylock(pthread_mutex_t * mutex); 
参数 mutex: 指向 互 斥 锁 对象 的 指针 

ang oA 


注意 : 加 锁 时 ,无 论 哪 种 类 型 的 锁 , 都 不 可 能 被 两 个 不 同 的 线程 同时 获得 。 在 同一 进 
程 中 的 线程 ,如 果 加 锁 后 没有 解锁 , 则 其 他 线程 将 无 法 再 获得 该 锁 。 


4. 释放 互 斥 锁 


当 线程 离开 临界 区 的 时 候 需 要 释放 已 经 获得 的 互 斥 锁 ,以 使 需 要 使 用 该 临界 资源 的 
其 他 线程 能 够 正常 使 用 。pthread_mutex_unlock 函数 用 于 释放 互 斥 锁 , 该 函数 的 接口 规 


范 说 明 如 表 9.6 所 示 。 
表 9.6  pthread mutex unlock 函数 的 接口 规范 说 明 


函数 名 称 pthread mutex unlock 

函数 功能 释放 互 斥 锁 

头 文件 # include <pthread. h> 

函数 原型 int pthread mutex unlock(pthread mutex t * mutex); 
参数 mutex: 指向 互 斥 锁 对 象 的 指针 

amt ER 


非 0: 失败 
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913 互 斥 锁 应 用 实例 


学 习 了 互 斥 锁 的 相关 概念 及 基本 操作 ,下 面 通过 示例 程序 9. 1 对 互 斥 锁 的 使 用 进行 
具体 说 明 。 


[示例 程序 9.1 exp mitex.c] 
# includec stdio.h> 

# includec stdlib.h> 

# include< pthread.h> 


pthread mutex t mtex; 
int sum- 0; 


typedef struct FuncArg 
t 

int start; 

int end; 
)FuncArg; 


void * thread handler (void * arg) 

( 
int start- ((Funchrg * Jarg)- > start +1; 
int end ((Funchrg * Jarg)- > end; 


for (; start« - end; ++ start) 
1 


pthread mtex lock(&mitex); // 申 请 锁 
sum += start; /临界 区 操作 
pthread mtex unlock (Smutex) ; // 释 放 锁 

) 

retum 0; 


int main(int argc, char * argv[]) 
t 
pthread t thids[4]; 
FuncArg arg[4]; 
pthread mutex init (gmtex, NULL); // 初 始 化 互 斥 锁 


int len- 10000 / 4; 
for (int i-0; i«4; ++i) 


t 
argli].start-len * i; 
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arg[i].end- len * (i+1); 
pthread create(&thids[i], NULL, thread handler, &arg[i]); 
} 


for (int i=0; i< 4; ++i) 
t 

int * ret; 

pthread join(thids[i], (void * * )&ret); 
) 


pthread mutex destroy (amitex) ; // 销 毁 互 斥 锁 
printf ("sum- d\n", sum); 


return EXIT SUCCESS; 
) 


示例 程序 9. 1 通过 多 线程 求 1 一 10000 的 和 。 编 译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 

root@ubuntu:~# ./exp mutex 

Sine 50005000 

对 于 示例 程序 9.1, 读 者 可 以 将 相关 互 斥 锁 的 操作 注释 掉 , 再 次 运行 对 比 一 下 有 互 斥 
锁 和 没有 互 斥 锁 的 区 别 。 


9.2 条 件 变 量 


在 对 线程 进行 操作 时 需要 在 一 定 条 件 下 互 斥 地 访问 临界 资源 。 比 如 有 一 个 缓存 区 
(字符 数组 ) , 当 缓 存 区 为 空 时 A 线程 向 其 中 写 人 “Hello Linux”, 当 缓存 区 中 有 数据 时 B 
线程 将 其 取出 并 打印 在 屏幕 上 。 这 种 情况 下 ,单纯 地 使 用 互 斥 锁 显 然 无 法 完全 满足 要 求 。 
这 个 时 候 就 需要 使 用 Linux 提供 的 另 一 个 同步 机 制 一 一 条 件 变 量 。 


921 条 件 变 量 基 本 原理 


条 件 变 量 类 似 于 if 语句, 它 有 “ 真 “ 假 ”两 个 状态 。 在 条 件 变量 的 使 用 过 程 中 一 个 线 
程 等 待 条 件 为 “ 真 ”, 男 一 个 线程 在 使 用 完 临界 资源 之 后 将 条 件 设置 为 “ 真 ”, 唤 醒 阻塞 在 等 
待 条 件 变量 为 “ 真 ”的 线程 ,执行 其 任务 。 在 这 个 过 程 中 必须 保证 在 并 发 /并 行 的 条 件 下 使 
得 条 件 变量 " 真 “ 假 "状态 正确 转换 ,所 以 条 件 变量 一 般 需 要 和 互 斥 锁 配 合 使 用 实现 对 资 
源 的 互 斥 访 问 。 
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1. 初始 化 条 件 变 量 
与 互 斥 锁 一 样 ,条 件 变 量 在 使 用 前 也 需要 对 其 进行 初始 化 ,pthread_cond_init 函数 用 
于 条 件 变 量 的 初始 化 ,该 函数 的 接口 规范 说 明 如 表 9.7 所 示 。 


表 9.7  pthread cond init 函数 的 接口 规范 说 明 


函数 名 称 pthread cond init 

函数 功能 初始 化 条 件 变量 

头 文件 include — pthread. h> 

函数 原型 int pthread cond init(pthread cond t * cv, const pthread condattr t * cattr); 
cv: 指向 要 初始 化 的 条 件 变 量 的 指针 

参数 cattr; 指向 条 件 变量 属性 的 指针 ,指定 条 件 变量 的 一 些 属性 ,如 果 为 NULL 则 表明 
使 用 默认 属性 初始 化 该 条 件 变量 

P 0: 成 功 

BME Dao 失败 


2. 阻塞 等 待 条 件 变 量 
Linux 中 使 用 pthread cond wait 函数 来 阻塞 等 待 信号 量 为 * 真 ”, 该 函数 的 接口 规范 
说 明 如 表 9.8 所 示 。 


表 9.8 pthread_cond_wait 函数 的 接口 规范 说 明 


函数 名 称 pthread_cond_wait 
函数 功能 等 待 条 件 变量 被 设置 
头 文件 # include — pthread. h> 
函数 原型 int pthread_cond_wait(pthread_cond_t * cond. pthread mutex t * mutex); 
参数 cond: 需要 等 待 的 条 件 变量 
mutex: 与 条 件 变 量 相关 的 互 斥 锁 
im 0 AN 


同时 Linux 也 提供 了 pthread cond timedwait 函数 , 它 可 以 指定 超时 时 间 «122 PA CBE 
口 规范 说 明 如 表 9. 9 所 示 。 


表 9.9 pthread_cond_timedwait 函数 的 接口 规范 说 明 


函数 名 称 pthread cond timedwait 
函数 功能 在 指定 的 时 间 之 内 阻塞 等 待 条 件 变量 
头 文件 # include <pthread. h> 
int pthread_cond_timedwait(pthread_cond_t * cond, pthread_mutex_t * mutex, 
函数 原型 const struct timespec * abstime) ; 
cond: 需要 等 待 的 条 件 变 量 
参数 mutex: 与 条 件 变量 绑 定 的 互 斥 锁 
abstime: struct timespec 类 型 的 指针 变量 ,传人 超时 时 间 ,该 变量 是 一 个 绝对 时 间 ， 
即 以 从 1970-01-01 00:00:00 以 来 的 秒 数 来 表示 
BE 0. 成 功 


非 0: 失败 
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3. 通知 等 待 该 条 件 变 量 的 线程 

POSIX 提供 两 个 函数 用 来 唤醒 等 待 的 线程 ,pthread_cond_signal 函数 用 来 唤醒 其 中 
一 个 等 待 线程 ,pthread_cond_broadcast 函数 用 来 唤醒 等 待 的 所 有 线程 ,这 两 个 函数 的 接 
口 规范 说 明 如 表 9. 10 和 表 9. 11 所 示 。 


表 9.10  pthread cond signal 函数 的 接口 规范 说 明 


函数 名 称 pthread_cond_signal 
函数 功能 唤醒 一 个 等 待 线程 
头 文件 € include — pthread. h> 
函数 原型 int pthread cond signal(pthread cond t * _cond); 
参数 cond; 需要 通知 的 条 件 变量 的 指针 
3 0: 成 功 
inpia 非 0: 失败 
表 9.11  pthread cond broadcast 函数 的 接口 规范 说 明 
函数 名 称 pthread cond broadcast 
函数 功能 唤醒 所 有 等 待 线程 
头 文件 # include <pthread. h> 
函数 原型 int pthread_cond_ broadcast (pthread cond t * __cond); 
参数 cond: 需要 广播 通知 的 条 件 变 量 的 指针 
ij 0: 成 功 
T 非 0: 失败 
4. 销毁 条 件 变 量 


条 件 变量 在 使 用 结束 后 需要 将 其 销毁 ,pthread_cond_destroy 函数 用 于 销毁 条 件 变 
it ,该 函数 的 接口 规范 说 明 如 表 9. 12 所 示 。 


表 9.12  pthread cond destroy 函数 的 接口 规范 说 明 


函数 名 称 pthread cond destroy 

函数 功能 销毁 条 件 变量 

头 文件 # include « pthread. h> 

函数 原型 int pthread cond destroy(pthread cond t * — cond); 
参数 cond: 需要 销毁 的 条 件 变量 

iau PER 
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掌握 了 条 件 变量 的 基本 原理 及 基本 操作 后 ,示例 程序 9. 2 使 用 条 件 变 量 完成 本 节 开 
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始 时 提出 的 问题 。 


[示例 程序 9.2 exp. cond.c] 
# include< stdio.h> 

# include< stdlib.h» 

# include< pthread.h» 

# include< string.h> 

# include< unistd.h» 


pthread mitex t mutex; //[8. Fe Bi 
pthread cond t empty; /为 空 的 条 件 变 量 
pthread cond t notempty; // 非 空 的 条 件 变量 


char buf [322]; 


void * producer(void * arg) 
t 
while(1) 
t 
printf ("producer is runing! n") ; 
pthread mitex lock(smitex); 


pthread cond wait(sempty, &mitex); // 等 待 缓存 区 为 空 
memcpy (buf, "Hello Linux", 11); // 写 人 数据 
pthread cond signal (&notempty) ; // 等 待 缓冲 区 非 空 


pthread mutex unlock (&mutex) ; 


retum 0; 


void * consume (void * arg) 
i 
while(1) 
t 
printf ("consume is runing! n") ; 
pthread mitex lock(smitex); 
pthread cond wait(snotempty, &mutex); // 等 待 缓存 区 不 为 空 
printf("recv data : $3n", buf); 
memset (buf, 0, 32); 
sleep(1); 
pthread cond signal(sempty); // 等 待 缓冲 区 为 空 
pthread mutex unlock (Smutex) ; 
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retum 0; 


int main(int argc, char * argv[]) 
{ 
pthread t thidl, thid2; 


pthread mutex init (gmtex, NULL); // 初 始 化 互 斥 锁 
pthread cond init(sempty, NULL); // 初 始 化 为 空 时 的 条 件 变 量 
pthread cond init(&notempty, NULL); // 初 始 化 不 为 空 时 的 条 件 变 量 


pthread create (gthidl, NULL, producer, NULL); 
pthread create (&thid2, NULL, consume, NULL); 


sleep(1); 

pthread cond signal (sempty) ; I8 

int * retl, * ret2; 

pthread join(thidl, (void * * )&retl); 

pthread join(thidD, (void * * )&ret2); 

pthread mutex destroy (&mitex) ; // 销 毁 互 斥 锁 
pthread cond destroy (&empty) ; // 销 毁 条 件 变 量 
pthread cond destroy (&notenpty) ; // 销 毁 条 件 变量 


return EXIT SUCCESS; 
) 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp cond 


consume is runing! 
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从 程序 运行 结果 可 以 看 出 ,consume 线程 取 数 据 时 ,缓冲 区 为 空 ,该 线程 被 阻塞 ,等 待 
producer 线程 向 当 缓存 区 写 人 数据 ,producer 线程 写 人 字符 串 “Hello Linux” 之 后 ,consume 
线程 被 唤醒 并 从 缓存 区 中 取出 数据 将 其 打印 在 屏幕 上 ,之 后 这 两 个 线程 交替 运行 。 


9.3 读 写 锁 


读 写 锁 与 互 斥 锁 类 似 。 多 个 线程 可 以 在 读 时 同时 获得 读 写 锁 ,但 在 写 的 时 候 只 有 一 
个 线程 能 获得 锁 , 即 读 写 锁 允许 对 一 个 被 保护 的 共享 资源 并 发 的 读 和 独占 的 写 。 读 写 锁 
提高 了 被 互 斥 锁 读 保护 的 资源 并 发 执行 的 程度 。 

931 读 写 锁 基本 原理 

读 写 锁 将 共享 资源 的 访问 者 分 为 读者 和 写 者 ,读者 只 对 共享 资源 进行 读 访问 , 写 者 只 对 
共享 资源 进行 写 操作 。 在 互 斥 机 制 中 ,读者 和 写 者 都 需要 独立 独占 互 斥 量 以 独占 共享 资源 ， 
在 读 写 锁 机 制 下 ,人 允许 同时 有 多 个 读者 读 访问 共享 资源 ,只 有 写 者 才 需 要 独占 资源 。 相 比 互 
斥 机 制 , 读 写 机 制 由 于 允许 多 个 读者 同时 读 访问 共享 资源 ,进一步 提高 了 多 线程 的 并 发 度 。 


读 写 锁 操作 主要 分 为 两 种 情况 : 
COD 写 者 竞争 到 锁 资源 。 在 写 者 加 锁 ,正在 写 的 情况 下 ,所 有 试图 竞争 这 个 锁 的 读者 
或 写 者 线程 都 会 被 阻塞 。 


(2) 读者 竞争 到 锁 资源 。 在 读者 加 锁 , 正 在 读 的 情况 下 ,为 了 体现 并 行 性 , 当 有 新 读 
者 试图 读 取 并 且 申 请 加 锁 的 时 候 , 将 被 允许。 也 就 是 说 ,一 块 共享 数据 可 以 同时 被 多 个 读 
者 读 取 。 但 当 有 读者 试图 写 时 ,将 被 阻塞 。 直 到 所 有 的 读者 线程 释放 锁 为 止 。 
932 读 写 锁 基 本 操作 

1. 初始 化 读 写 锁 

pthread_rwlock_init 函数 用 于 初始 化 读 写 锁 ,该 函数 的 接口 规范 说 明 如 表 9. 13 
所 示 。 


表 9.13 pthread_rwlock_init 函数 的 接口 规范 说 明 


函数 名 称 | pthread rwlock init 
函数 功能 | 初始 化 读 写 锁 
头 文件 # include — pthread. h> 


int pthread_rwlock_init (pthread rwlock t * __ restrict __rwlock, const pthread _ 


函数 原型 
rwlockattr t * — restrict attr); 
restrict | rwlock: 指向 要 初始 化 的 读 写 锁 的 指针 

参数 __restrict_attr: 指向 属性 对 象 的 指针 ,该 属性 对 象 定义 要 初始 化 的 读 写 锁 的 特性 ,如 
果 为 NULL 则 使 用 默认 属性 

BE 0: 成 功 


非 0: 失败 
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成 功 初 始 化 后 , 读 写 锁 的 状态 为 非 锁定 的 。 

2. 读 取 读 写 锁 中 的 锁 

pthread rwlock rdlock 函数 以 阻塞 方式 获取 读 写 锁 ,该 函数 的 接口 规范 说 明 如 
表 9. 14 所 示 。 


表 9.14  pthread rwlock rdlock 函数 的 接口 规范 说 明 


函数 名 称 | pthread rwlock rdlock 


以 阻塞 方式 在 读 写 锁 上 获取 读 锁 ( 读 锁 定 ) 
函数 功能 | 如 果 没 有 写 者 持 有 该 锁 ,并 且 没 有 写 者 阻塞 在 该 锁 上 , 则 调用 线程 会 获取 读 锁 。 如 果 调 
用 线程 未 获取 读 锁 , 则 该 线程 被 阻塞 直到 它 获取 了 该 锁 


头 文件 # include — pthread. h> 


函数 原型 | int pthread rwlock rdlock(pthread rwlock t *__rwlock); 


参数 __rwlock: 读 写 锁 指 针 
0: 成 功 
返回 值 | 非 0: 失败 


如 果 一 个 线程 写 锁定 了 读 写 锁 , 调 用 pthread_rwlock_rdlock 函数 的 线程 将 无 法 读 锁 
定 读 写 锁 ,并 将 被 阻塞 ,直到 线程 可 以 读 锁定 这 个 读 写 锁 为 止 。 如 果 一 个 线程 写 锁定 了 读 
写 锁 后 又 调用 pthread_rwlock_rdlock 函数 来 读 锁定 同一 个 读 写 锁 ,结果 将 无 法 预测 。 

3. 读 取 非 堵塞 读 写 锁 中 的 锁 

pthread rwlock trylock 函数 以 非 阻塞 方式 获取 读 写 锁 ,该 函数 的 接口 规范 说 明 如 
表 9.15 所 示 。 


3€ 9.15  pthread rwlock tryrdlock 函数 的 接口 规范 说 明 


函数 名 称 pthread rwlock tryrdlock 
函数 功能 以 非 阻塞 的 方式 在 读 写 锁 上 获取 读 锁 
如 果 有 任何 的 读者 持 有 该 锁 或 有 写 者 阻塞 在 该 读 写 锁 上 , 则 立即 失败 返回 
头 文件 * include — pthread. h> 
函数 原型 int pthread_rwlock_ tryrdlock(pthread_rwlock_t * _rwlock)， 
参数 —rwlock: 读 写 锁 指针 
ama | goram 


当 已 有 线程 写 锁定 读 写 锁 ,或 是 有 试图 写 锁 定 的 线程 被 阻塞 时 ,pthread_rwlock_ 
tryrdlock 函数 失败 返回 。 

4. 写 入 读 写 锁 中 的 锁 

pthread rwlock wrlock 函数 以 阻塞 方式 写 入 读 写 锁 中 的 锁 , 该 函数 的 接口 规范 说 明 
如 表 9. 16 所 示 。 
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表 9.16 pthread_rwlock_wrlock 函数 的 接口 规范 说 明 


函数 名 称 pthread_rwlock_wrlock 
以 阻塞 方式 在 读 写 锁 上 获取 写 锁 ( 写 锁定 ) 

函数 功能 如 果 没 有 写 者 持 有 该 锁 , 并 且 没 有 读者 持 有 该 锁 , 则 调用 线程 会 获取 写 锁 
如 果 调 用 线程 未 获取 写 锁 , 则 该 线程 被 阻塞 直到 它 获 取 了 写 锁 

头 文件 # include — pthread. h> 

函数 原型 int pthread rwlock wrlock(pthread rwlock t * — rwlock); 

参数 __rwlock: 读 写 锁 指针 

y 0: 成 功 

ena 非 0: 失败 


如 果 没 有 线程 读 或 写 锁 定 读 写 锁 __rwlock, 当前 线程 将 写 锁定 读 写 锁 __rwlock。 否 
则 线程 将 被 阻塞 ,直到 没有 线程 锁定 这 个 读 写 锁 为 止 。 

5. 写 入 非 堵塞 读 写 锁 中 的 锁 

pthread rwlock trywrlock 函数 以 非 阻塞 方 式 写 入 读 写 锁 中 的 锁 , 该 函数 的 接口 规 
范 说 明 如 表 9. 17 所 示 。 


表 9.17 pthread_rwlock_trywrlock 函数 的 接口 规范 说 明 


函数 名 称 pthread_rwlock_try wrlock 
函数 功能 以 非 阻塞 的 方式 来 在 读 写 锁 上 获取 写 锁 
如 果 有 任何 的 读者 持 有 该 锁 或 有 写 者 阻塞 在 该 读 写 锁 上 , 则 立即 失败 返回 
头 文件 # include — pthread. h> 
函数 原型 int pthread_rwlock_try wrlock(pthread rwlock t *__rwlock); 
参数 __rwlock: 读 写 锁 指针 
— 下 0 
6. 释放 读 写 锁 
pthread rwlock unlock 函数 解除 锁定 的 读 写 锁 , 该 函数 的 接口 规范 说 明 如 表 9. 18 
所 示 。 
389.18 pthread_rwlock_unlock 函数 的 接口 规范 说 明 
函数 名 称 pthread_rwlock_unlock 
函数 功能 释放 读 写 锁 
头 文件 # include — pthread. h> 
函数 原型 int pthread rwlock unlock(pthread rwlock t * — rwlock); 
参数 __rwlock: 读 写 锁 指针 
Ea | Vire 
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7. 销毁 读 写 锁 
pthread rwlock destroy 函数 用 于 销毁 一 个 读 写 锁 , 该 函数 的 接口 规范 说 明 如 
表 9. 19 所 示 。 


表 9.19 pthread_rwlock_destroy 函数 的 接口 规范 说 明 


函数 名 称 pthread rwlock destroy 
函数 功能 用 于 销毁 一 个 读 写 锁 , 并 释放 由 pthread_rwlock_init 函数 自动 申请 的 相关 资源 
头 文件 # include <pthread. h> 


函数 原型 int pthread rwlock destroy(pthread rwlock t * — rwlock); 
参数 __rwlock: 读 写 锁 指 针 

y 0: 成 功 

iaka 非 0; 失败 


933 读 写 锁 应 用 实例 


在 示例 程序 9. 3 中 ,创建 了 4 个 线程 ,其 中 两 个 线程 用 来 写 和 数据 ,两 个 线程 用 来 读 
取 数 据 。 当 某 个 线程 进行 读 操作 时 ,其 他 线程 允许 读 操作 ,但 不 允许 写 操作 ; 当 某 个 线程 
进行 写 操作 时 ,其 他 线程 都 不 允许 读 或 写 操作 。 


[示例 程序 9.3 exp. rwlock.c] 
# includec stdio.h> 

# include< unistd.h» 

# include< pthread.h> 


pthread rwlock t rwlock; // 读 写 锁 
int nwe 1; 


// 读 操作 ,其 他 线程 允许 读 操 作 ,但 不 允许 写 操作 
void * funl(void * arg) 
$ 
while(1) 
t 
pthread rwlock rdlock(&rwlock); 
printf ("first read num:$d Wn", num) ; 
pthread rwlock unlock (&rwlock); 
sleep(1); 


} 


// 读 操作 ,其 他 线程 允许 读 操作 ,但 不 允许 写 操作 
void * fun2(void * arg) 
t 

while) 
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pthread rwlock rdlock(&rwlock); 
printf ("second read num:&dWn" num) ; 
pthread rwlock unlock (&rwlock); 
Sleep); 


// 写 操作 ,其 他 线程 都 不 允许 读 或 写 操作 
void * fun3(void * arg) 
t 

while() 

t 


pthread rwlock wrlock (&rwlock); 
num; 

printf ("write thread oneWn") ; 
pthread rwlock unlock (&rwlock); 
aleep (1)7 


// 写 操作 ,其 他 线程 都 不 允许 读 或 写 操作 
void * fun4(void * arg) 
t 

while(1) 

{ 


pthread rwlock wrlock(&rwlock); 
mm +; 

printf ("write thread two\n"); 
pthread rwlock unlock (&rwlock); 
sleep(2); 


int main (void) 
{ 
pthread t ptdl, ptd2, ptd3, ptdá; 


pthread rwlock init(&rwlock, NULL); —— // 初 始 化 一 个 读 写 锁 


// 创 建 线程 

pthread create (sptdl，NULL，fanl，NULLD) ; 
pthread create (&ptd2, NULL, fun2, NULL); 
pthread create (sptd3, NULL, fun3, NULL); 
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pthread create(&ptd4, NULL, fun4, NULL); 


// 等 待 线程 结束 ,回收 其 资源 
pthread join (ptdl, NULL); 
pthread join (ptd2, NULL) ; 
pthread join (ptd3, NULL); 


pthread join (ptd4, NULL) ; 


pthread rwlock destroy (&rwlock); // 销 毁 读 写 锁 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp rwlock 
write thread two 
write thread one 
second read num:3 
first read num:3 
write thread one 
first read num:4 
write thread two 
Second read num:5 
write thread one 
first read num:6 
write thread one 
first read num:7 
write thread two 


9.4 线程 与 信号 


信和 号 是 一 种 IPC 通信 的 形式 ,一般 在 UNIX, % UNIX 或 POSIX 兼容 的 系统 中 使 用 。 
信号 是 一 种 异步 通知 进程 或 同一 进程 中 某 个 指定 线程 的 方式 。 

进程 内 创建 线程 时 ,新 线程 将 继承 进程 (主线 程 ) 的 信号 屏蔽 字 , 但 新 线程 的 未 决 信号 
集 被 清空 (以 防 同一 信号 被 多 个 线程 处 理 ) 。 线 程 的 信号 屏蔽 字 是 私有 的 (定义 当前 线程 
要 求 阻塞 的 信号 集 ), 即 线程 可 独立 地 屏蔽 某 些 信号 。 这 样 ,应 用 程序 可 控制 哪些 线程 响 
应 哪些 信号。 
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信号 处 理 函 数 被 进程 内 所 有 线程 共享 。 这 意味 着 尽管 单个 线程 可 阻止 某 些 信号 ,但 
当 线 程 修改 某 信号 相关 的 处 理 行为 后 ,所 有 线程 都 共享 该 处 理 行为 的 改变 。 这 样 , 当 线程 
选择 忽略 某 信号 ,而 其 他 线程 可 恢复 信号 的 默认 处 理 行为 或 为 信号 设置 新 的 处 理 函 数 ,从 
而 撤销 原先 的 忽略 行为 。 即 对 某 个 信号 处 理 函 数 ,以 最 后 一 次 注册 的 处 理 函 数 为 准 , 从 而 
保证 同一 信号 被 任意 线程 处 理 时 行为 相同 。 此 外 ,若菜 信号 的 默认 动作 是 停止 或 终止 , 则 
不 管 该 信号 发 往 哪个 线程 ,整个 进程 都 会 停止 或 终止 。 
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1. 向 线程 发 送信 号 
pthread_kill 函数 用 于 向 线程 发 送 一 个 信号 ,该 函数 的 接口 规范 说 明 如 表 9. 20 所 示 。 


表 9.20 pthread kill 函数 的 接口 规范 说 明 


函数 名 称 pthread kill 

函数 功能 向 同一 个 进程 中 指定 的 线程 (包括 自己 ) 发 送信 号 

头 文件 # include signal. h> 

函数 原型 int pthread kill (pthread t — threadid, int — signo) ; 
—threadid; 传送 信号 的 目标 线程 ID 

参数 signo: 表示 要 传送 给 线程 的 信号 ,如 果 为 0, 则 用 于 检测 该 线程 是 否 存在 ,而 不 发 
送信 号 

" 0: 成 功 

BME S [ao 失败 


2. 调用 线程 的 信号 掩 码 
pthread sigmask 函数 用 于 更 改 或 检查 线程 的 信号 掩 码 , 该 函数 的 接口 规范 说 明 如 
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表 9.21 pthread_sigmask 函数 的 接口 规范 说 明 


函数 名 称 pthread_sigmask 
函数 功能 更 改 或 检查 调用 线程 的 信号 掩 码 
头 文件 # include 一 signal. h> 
int pthread sigmask (int  how,.const  sigset t * restrict newmask, 
umm —sigset t * restrict oldmasl ; 
how: 更 改 调用 线程 的 信号 掩 码 
参数 __newmask: 为 NULL 时 how 没有 意义 , 非 NULL 时 通过 how 指示 如 何 修改 线程 
阻塞 信号 集 
__oldmask: 当前 线程 阻塞 集 
` 0: 成 功 
返回 值 4o 失败 


第 一 个 参数 how 定义 如 何 更 改 调用 线程 的 信号 掩 码 , 取 值 有 如 下 三 种 。 
* SIG BLOCK : 将 第 二 个 参数 所 描述 的 集合 添加 到 当前 进程 阻塞 的 信号 集中 。 
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* SIG UNBLOCK ; 将 第 二 个 参数 所 描述 的 集合 从 当前 进程 阻塞 的 信号 集中 删除 。 
。SIG_SETMASK: 不 管 之 前 的 阻塞 信号 , 仅 设置 当前 进程 组 合 的 集合 为 第 二 个 参 
数 描述 的 对 象 。 


942 线程 信号 应 用 实例 
示例 程序 9. 4 使 用 pthread_kill 系统 调用 检测 一 个 线程 是 在 系统 中 存活 。 


[示例 程序 9.4 exo kill.c] 
# include& stdio.h» 

# include« stdlib.h» 

# include pthread.h» 

# include« ermo.h» 


void * funcl() 

t 
Sleep (1) 7 
printf ("thread 1 (id: $u)quit.\n",pthread self ()); 
pthread exit((void * )0); 


void * func2() 

t 
sleep(5); 
printf ("thread 2(id: $u)quit.Wn",pthread self()); 
pthread exit((void * )0); 


void test pthread(pthread t tid) 
t 
int pthread kill err; 


pthread kill err-pthread kill(tid,0); 


if (pthread kill err-—ESRCH) 
printf("ID 为 su 的 线程 不 存在 或 者 已 经 退出 。\n",tig); 
else if (pthread kill err-- EINVAL) 
Printf(" 发 送信 号 非法 。\nm; 
else 
printf (TD 为 su 的 线程 目前 仍然 存活 。\nvtid) 
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pthread t tidl,tid?; 


pthread create (&tidl, NULL, funcl, NULL) ; 
pthread create (&tid?, NULL, func2, NULL) ; 


Sleep(3); 
// 测 试 线程 是 否 存在 


} 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


root@ubuntu:~ # ./exp cond 

thread 1(id: 1674008800) quit. 

ID 1674028800 的 线程 不 存在 或 者 已 经 退出 。 
攻 为 1665636096 的 线程 目前 仍然 存活 。 


从 程序 运行 结果 可 以 看 出 ,id 为 210556672 的 线程 因为 退出 ,根据 pthread_kill 函数 
的 返回 值 判断 线程 死亡 ,id 为 202163968 的 线程 仍 在 运行 ,根据 返回 值 判断 线程 存活 。 
示例 程序 9. 5 在 线程 中 发 送信 号 和 屏蔽 信和 号。 


[示例 程序 9.5 exp_signal.c] 
# include< pthread.h> 

# include< stdio.h> 

# include< stdlib.h> 

# include< signal.h» 


void sigusr handle(int arg) 
t 
printf ("thread (id= $u) catch signal d\n", pthread self(), arg); 


void * thl handle(void * arg) 
$ 
int i; 


sigset t set; 
sigfillset(&set); 

sigdelset (&set，SIGUSR2) 

pthread sigmask(SIG SEIMASK, &set, 0); 


signal (SIGUSRI, sigusr handle); 
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for (i-0; i«5; 计 +) 

f 
printf ("this is in thread 1 (id %u)\n", pthread self ()); 
pause(); 


void * th2 handle(void * arg) 


i 
inti; 
signal(SIGUSEO, sigusr handle); 
for (i-0; i« 5; it*) 
t 
printf ("this is in thread 2 (id= $u) Vn", pthread self ()); 
pause (); 
} 
) 
int main (void) 
{ 


pthread t mythreadl, mythread?; 
int ret; 


ret= pthread create(&mythreadl, NULL, thl handle, NULL); 
if (ret!=0) 
£ 

printf ("create thread failed!\n"); 


ret= pthread create (&mythread2, NULL, th2 handle, NULL); 
if (ret!-0) 
t 

printf ("create thread failed!in"); 


sleep(1); 


ret-pthread kill(mythreadl, SIGUSRI); 

if (ret!- 0) 

£ 
printf ("pthread kill SIGUSRI failed!\n"); 
exit(1); 
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printf ("pthread kill SIGUSE2 failed!\n"); 
exit(1); 


ret=pthread kill (mythread?, SIGUSRI) ; 

if (ret!- 0) 

( 
printf ("pthread kill STGUSR1 failed!Wn"); 
exit (1); 


sleep (); 


ret-pthread kill(mythread2, SIGUSR2) ; 

if (ret!- 0) 

1 
printf ("pthread kill SIGUSR2 failed!Wn"); 
exit(1); 


ret-pthread kill(mythreadl, SIGKILL) ; 
if (ret!- 0) 
t 
printf ("pthread kill SIGKILL failed!Wn"); 
exit(); 


} 


在 示例 程序 9. 5 中 ,主线 程 分 别 创建 两 个 线程 ,在 线程 1 中 ,屏蔽 SIGUSR2 之 外 的 
所 有 信号 同时 设置 SIGUSRI 的 信号 处 理 函 数 ;在 线程 2 中 ,设置 SIGUSR2 的 信号 处 理 
函数 ;在 主线 程 中 ,分 别 向 线程 1 发 送 SIGUSR1、SIGUSR2 信号 ,分 别 向 线程 2 发 送 


SIGUSRI,SIGUSR? 信号 。 最 后 ,向 线程 1 发 送 SIGKILL 信号 。 
编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 
root@ubuntu:~ # ./exp cond 
this is in thread 2 (id- 1181099776) 
this is in thread 1 (id- 1189490480) 
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thread(id- 1181099776) catch signal 10 

this is in thread 2 (id- 1181099776) 

thread(id- 1189492480) catch signal 12 

this is in thread 1 (id- 1189492480) 

Killed 

程序 运行 结果 表明 : 线程 捕获 到 自 定义 信号 并 执行 相应 的 操作 ,而 当 信号 为 
SIGKILL 时 整个 进程 全 部 终止 。 


9.5 小 结 


如 果 变 量 是 只 读 的 ,多 个 线程 同时 读 取 该 变量 不 会 有 一 致 性 问题 。 但 是 , 当 一 个 线程 
可 以 修改 变量 ,其 他 线程 也 可 以 读 取 或 者 修改 的 时 候 , 就 需要 对 这 些 线程 进行 同步 ,确保 
它们 在 访问 变量 的 存储 内 容 时 不 会 访问 到 无 效 的 值 。 本 章 介绍 了 Linux 中 常用 的 解决 线 
程 同 步 方式 的 互 斥 锁 、 条 件 变量 . 读 写 锁 和 信号 的 基本 原理 和 基本 操作 ,针对 每 种 同步 机 
制 给 出 了 具体 实例 。 通 过 本 章 学 习 , 读 者 需要 对 线程 间 常 用 的 同步 机 制 熟练 掌握 。 


习 题 


一 、 填空 题 

1. 按照 POSIX 标准 ,线程 同步 机 制 有 ` 和 

2. 函数 用 来 初始 化 一 个 互 斥 锁 。 

3. 使 用 互 斥 锁 同步 多 个 线程 对 临界 资源 访问 的 操作 流程 为 、 JA 
问 临 界 资源 、 

二 、 简 答题 

l. 简 述 条 件 变 量 实现 同步 的 原理 。 

2. 简 述 如 何 使 用 读 写 锁 来 同步 多 个 线程 对 互 斥资 源 的 访问 。 

三 、 编 程 题 
. 编写 一 个 多 线程 程序 ,在 主线 程 中 创建 3 个 子 线程 ,3 个 子 线程 在 执行 时 都 修改 一 
个 它们 共享 的 变量 ,观察 共享 变量 的 值 ,看 看 可 以 得 出 什么 结论 。 
2. 编写 一 个 包含 2 个 线程 的 程序 ,在 主线 程 中 接收 键盘 输入 ,并 将 输入 的 字符 放 入 
缓冲 区 中 ,缓冲 区 满 后 ,由 另 一 个 线程 输出 缓冲 区 的 内 容 , 用 互 斥 锁 实现 二 者 之 间 的 同步 。 

3. 编写 一 个 包含 2 个 线程 的 程序 ,在 主线 程 中 创建 一 个 全 局 变量 并 初始 化 为 0, 在 另 
一 个 线程 中 对 这 个 全 局 变量 进行 递减 运算 ,并 在 线程 结束 时 将 运算 结果 返回 给 主线 程 , 由 
主线 程 打印 输出 。 
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Linux 操作 系统 本 身 是 一 个 网 络 的 产物 , 它 在 网 络 上 可 以 供 人 们 自由 下 载 ,并 得 到 修 
改 和 完善 。 同 时 ,Linux 也 提供 了 强大 的 通信 和 联网 功能 ,并 且 由 于 Linux 操作 系统 的 网 
络 连 接 在 内 核 中 完成 ,因此 十 分 稳定 可 靠 。Linux 操作 系 支持 多 种 网 络 协议 , 它 的 Shell 
还 提供 了 强大 的 联网 命令 ,这 使 得 Linux 为 许多 中 小 型 的 应 用 提供 了 完全 的 解决 方案 ,并 
充分 显示 了 其 优 于 Windows 操作 系统 的 网 络 功能 。 


10.1 网 络 知识 基础 


1011 TCRPIP 参 考 模型 


TCP/IP 协议 最 初 是 由 美国 政府 资助 的 美国 高 等 研究 计划 署 的 网 络 ARPANET 上 
发 展 起 来 的 ,该 网 络 用 于 支持 美国 军事 和 计算 机 科学 研究 。 在 ARPANET 的 研究 中 首次 
提出 了 诸如 报 文 交换 .协议 分 层 等 网 络 概念 。1988 年 以 后 ,ARPANET 由 其 继任 者 -一 
美国 国家 科学 基金 会 NSFNET 所 取代 ,而 NSFNET 和 全 世界 数 以 万 计 的 局 域 网 和 城 域 
网 共同 连接 成 了 一 个 巨大 的 联合 体 (Internet) ,众所周知 的 万 维 网 (World Wide Web) 3i 
是 利用 TCP/IP 协议 在 ARPANET 上 发 展 起 来 的 。UNIX 被 广泛 应 用 于 ARPANET 
中 , 它 的 第 一 个 网 络 版 是 4. 3BSD(Berkeley Software Distribution) ,该 版 本 支持 BSD 的 
套 接 字 和 全 部 TCP/IP 协议 ,Linux 的 网 络 功 能 就 是 基于 这 个 版 本 实现 的 。 

TCP/IP 模型 是 当前 互联 网 实际 遵守 的 协议 模型 ,TCP/IP 协议 是 由 七 层 模型 (OSI 
模型 ) 简 化 而 来 。 七 层 模型 自 底 向 上 分 别 是 : 物理 层 、 数 据 链 路 层 、 网 络 层 、 传 输 层 、 会 话 
层 、 表 示 层 .应 用 层 。 简 化 后 的 四 层 分 别 是 : 主机 到 网 络 层 (比特 ) 、 网 络 层 (数据 帧 )、 传 输 
层 ( 数 据 包 ) 、 应 用 层 (数据 段 )。 每 一 层 对 于 上 一 层 来 讲 是 透明 的 ,上 层 只 需要 使 用 下 层 提 
供 的 接口 ,并 不 关心 下 层 是 如 何 实 现 的 。TCP/IP 参考 模型 和 OSI 参考 模型 对 比如 
图 10.1 所 示 。 

相 比 较 OSI 参考 模型 ,TCP/IP 参考 模型 将 OSI 参考 模型 中 的 应 用 层 、 表 示 层 以 及 会 
话 层 统一 合并 为 应 用 层 ,并 且 将 OSI 参考 模型 中 的 数据 链 路 层 和 物理 层 统一 合并 为 主机 
到 网 络 层 。 


1012 Linx} TCRPIP 网 络 的 层 结构 
TCP/IP 参考 模型 各 层 的 功能 如 下 : 
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应 用 层 

表示 层 | 应 用 层 

会 话 层 

传输 层 传输 层 

网 络 层 网 络 层 
数据 链 路 层 

ux 一 | 主机 到 网 络 层 
OSI 参考 模型 TCP/IP 参 考 模型 


图 10.1 TCP/IP 参考 模型 和 OSI 参考 模型 对 比 


CD 主机 到 网 络 层 : 又 称 为 网 络 接口 层 ,是 整个 模型 的 基层 ,该 层 在 TCP/IP 参考 模 
型 中 并 没有 描述 具体 的 实现 , 仅 规定 了 其 需要 为 网 络 互联 层 提供 访问 接口 ,具体 实现 由 具 
体 的 网 络 类 型 而 定 。 

(2) 网 络 层 : 该 层 将 数据 包 进 行 分 组 并 发 送 至 目标 网 络 或 主机 。 由 于 一 个 数据 包 的 
不 同 分 组 可 能 会 经 过 不 同 的 路 径 进 行 传送 ,造成 了 接收 方 收 到 的 分 组 乱 序 ,所 以 需要 该 层 
对 数据 包 进 行 排序 。 这 里 有 4 种 网 络 互 连 协议 。 

* 网 际 协议 IP: 负责 在 主机 和 网 络 之 间 的 路 径 寻 址 和 数据 包 路 由 。 

* 地 址 解析 协议 ARP: 获得 同一 物理 网 络 中 的 主机 硬件 地 址 。 

。 网 际 控制 消息 协议 ICMP: 发 送 消息 ,并 报告 有 关 数 据 包 的 传送 错误 。 

。 互联 组 管理 协议 IGMP: 用 来 实现 本 地 多 路 广播 路 由 器 报告 。 

G) 传输 层 : 该 层 向 它 上 面 的 应 用 层 提供 通信 服务 ,并 提供 源 主 机 和 目标 主机 上 对 
等 层 之 间 进 行 会 话 的 机 制 。 在 传输 层 定义 了 传输 控制 协议 (Transmission Control 
Protocol, TCP) 和 用 户 数 据 报 协议 (User Datagram Protocol, UDP), TCP 协议 是 面向 
连接 的 .可靠 的 协议 ,而 UDP 协议 是 不 可 靠 的 .无 连接 协议 。 

(4) 应 用 层 : 该 层 直接 为 应 用 程序 提供 接口 和 常见 的 网 络 应 用 服务 。 在 传输 层 的 
TCP 和 UDP 基础 上 ,该 层 实 现 了 很 多 应 用 层 协议 ,如 FTP HTTP DNS 等 。 
FPT: 提供 应 用 级 的 文件 传输 服务 。 
TELNET: 提供 远程 登录 服务 。 
SMTP: 电子 邮件 协议 。 
SNMP: 简单 网 络 管理 协议 。 
DNS: 域名 解析 服务 。 
HTTP: 超 文本 传输 协议 。 


1013 TCP 协 议 


TCP 是 Transmission Control Protocol( 传 输 控 制 协议 ) 的 缩写 ,该 协议 是 面向 连接 
的 通信 协议 ,提供 可 靠 的 数据 传送 。TCP 协议 将 源 主机 应 用 层 的 数据 分 成 多 个 分 段 , 将 
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每 个 分 段 传输 到 网 际 层 ,网 际 层 将 数据 封装 为 IP 数据 包 , 并 发 送 到 目的 主机 。 

图 10. 2 是 TCP 程序 设计 流程 框架 ,服务 器 调用 socket, bind, listen 函数 完成 初始 化 
后 ,调用 accept 函数 阻塞 等 待 ,此 时 ,服务 器 处 于 监听 端口 的 状态 。 客 户 端 调用 socket PR 
数 初始 化 后 ,接着 调用 connect 函数 发 出 SYN 段 并 阻塞 ,等 待 服务 器 应 答 。 服 务 器 应 答 
一 个 SYN-ACK 段 , 客 户 端 收 到 后 从 connect 函数 返回 ,同时 应 答 一 个 ACK 段 ,服务 器 收 
到 后 从 accept 函数 返回 。 


TCP 服 务 器 端 TCP 客 户 端 
建立 socket() 建立 socket() 
J 
HEbind) 
! 
建立 监听 listen() 


| 


Y 
响应 客户 请 求 accept0 [—9— — — ——] 请 求 链接 connect() 


| | 


发 送 数据 snd0 — .— — — 接收 数据 recvO 


| | 


关闭 close() 关闭 close() 


图 10.2 TCP 程序 设计 流程 


数据 传输 的 过 程 为 : 建立 连接 后 ,TCP 协议 提供 全 双 工 的 通信 服务 ,但 是 一 般 的 客 
户 端 /服务 器 程序 流程 是 由 客户 端 主动 发 起 请 求 ,服务 器 被 动 处 理 请 求 ,一 问 一 答 的 方式 。 
因此 ,服务 器 从 accept 函数 返回 后 立刻 调用 read. 函数 进行 读 操作 ,如 果 没 有 数据 到 达 就 
阻塞 等 待 。 这 时 客户 端 调 用 write 函数 发 送 请 求 给 服务 器 ,服务 器 收 到 后 从 read 函数 返 
回 ,对 客户 端的 请 求 进行 处 理 。 在 此 期 间 客户 端 调用 read 函数 阻塞 等 待 服务 器 的 应 答 ， 
服务 器 调用 write 函数 将 处 理 结果 发 回 给 客户 端 ,再 次 调用 read 函数 阻塞 等 待 下 一 条 请 
求 , 客 户 端 收 到 后 从 read 函数 返回 ,发 送 下 一 条 请 求 ,如 此 循环 下 去 。 如 果 客 户 端 没有 更 
多 的 请 求 了 ,就 调用 close 函数 关闭 连接 ,服务 器 的 read 函数 返回 0, 这 样 服务 器 就 知道 
客户 端 关闭 了 连接 ,也 调用 close 函数 关闭 连接 。 


1014 UDP 协议 


UDP 是 User Datagram Protocol( 用 户 数据 报 协议 ) 的 缩写 ,该 协议 是 面向 无 连接 的 
通信 协议 ,不 能 提供 可 靠 的 数据 传送 ,而 且 UDP 不 进行 差错 校 验 ,必须 由 应 用 层 的 应 用 
程序 实现 可 靠 性 机 制 和 差错 控制 ,以 保证 端 到 端 数据 的 正确 性 。UDP 编程 分 为 客户 端 和 
服务 器 两 部 分 ,服务 器 编写 的 流程 包括 建立 套 接 字 、 套 接 字 与 地 址 结构 进行 绑 定 、 读 写 数 
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据 以 及 关闭 套 接 字 , 客 户 端 编写 的 流程 包括 建立 套 接 字 、 读 写 数据 以 及 关闭 套 接 字 , 相 比 
较 服 务 器 程序 ,客户 端 程序 在 编写 时 可 以 不 将 地 址 和 端口 进行 绑 定 。 

图 10.3 是 UDP 程序 设计 流程 框架 ,服务 器 首先 通过 socket PRICE vr E Ben PA 
进行 地 址 结构 与 套 接 字 文 件 描述 符 的 绑 定 , 绑 定 完成 后 就 可 通过 recvfrom 函数 从 建立 的 
套 接 字 中 接收 数据 ,也 可 以 通过 sendto 函数 向 套 接 字 发 送 数据 。 客 户 端 相 比 较 服务 器 流 
程 缺少 调用 bind 函数 进行 绑 定 的 部 分 ,因为 客户 端 程序 的 端口 和 地 址 在 使 用 时 由 系统 进 
行 指定 。 


UDP 服务 器 端 UDP 客户 端 
建立 socket() 建立 socket() 
1 | 
绑 定 bind() "d 发 送 数据 sendto0) 
太一 | 接收 数据 recvfrom() 
| | 
发 送 数据 snd0 ”上 一 一 一 一 接收 数据 recvfrom() 
| i 
关闭 close() 关闭 close() 


图 10.3 UDP 程序 设计 流程 


10.2 套 接 字 


在 前 面 的 章节 中 ,介绍 了 几 种 常见 的 进程 间 通信 方式 : 管道 .共享 内 存 、 消 息 队列 等 ， 
但 是 这 些 方式 都 是 依靠 一 台 计算 机 系统 的 共享 资源 实现 ,这 些 资源 可 以 是 文件 系统 空间 、 
共享 的 物理 内 存 或 消息 队列 等 ,但 只 有 运行 在 同一 台 及 其 上 的 进程 才能 使 用 它们 。 如 果 
想 要 跨 机 器 通信 ,在 网 络 上 传递 数据 ,就 要 通过 套 接 字 (socket) 来 实现 。 


1021 套 接 字 概 述 


套 接 字 是 一 种 通信 和 机制, 凭借 这 种 机 制 ,客户 端 /服务 器 系统 的 开发 工作 既 可 以 在 本 
地 单机 上 进行 ,也 可 以 跨 机 器 进行 。Linux 所 提供 的 连接 数据 库 、Web 页 面 、 用 于 远程 登 
录 的 rlogin 等 通常 都 是 通过 套 接 字 进行 通信 的 。 

常用 的 套 接 字 有 三 种 类 型 ; 

CD 流 式 套 接 字 (SOCK_STREAM): 提供 了 一 个 可 靠 的 ,面向 连接 的 数据 传输 服 
务 ,数据 无 差错 、 无 重复 的 发 送 且 按 发 送 顺 序 接收 。 

COD 数据 报 套 接 字 (SOCK_DGRAM): 提供 了 一 种 无 连接 的 服务 ,数据 通过 相互 独 
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立 的 报 文 进行 传输 ,是 无 序 的 ,并 且 不 保证 可 靠 ,无 差错 。 

(3) 原始 套 接 字 (SOCK_RAW): 主要 用 于 一 些 协议 的 开发 ,可 以 进行 比较 底层 的 
操作 。 

套 接 字 用 于 描述 IP 地 址 和 端口 ,是 一 种 特殊 的 I/O, 应 用 程序 通常 通过 套 接 字 向 网 
络 发 出 请 求 或 接受 应 答 , 套 接 字 完 美 地 屏 珊 了 网 络 底层 的 细节 ,用 户 只 需要 使 用 不 同 的 参 
数 就 可 以 实现 在 不 同 的 网 络 协议 上 收发 数据 。 一 个 典型 的 客户 端 /服务 器 场景 中 ,应 用 程 
序 使 用 套 接 字 进 行 通信 的 方式 如 下 : 

客户 端 和 服务 器 同时 创建 一 个 套 接 字 用 于 通信 。 

服务 器 将 自己 的 套 接 字 绑 定 到 一 个 众所周知 的 地 址 (名 称 ) ,之 后 客户 端 连接 它 完 
通信 。 
122 套 接 字 编 程 接口 


1. 创建 一 个 新 的 套 接 字 
创建 新 的 套 接 字 使 用 socket 系统 调用 ,该 接口 规范 说 明 如 表 10. 1 所 示 。 


表 10.1 socket 函数 的 接口 规范 说 明 


函数 名 称 socket 

函数 功能 创建 一 个 新 的 套 接 字 
# include <sys/types. h> 

XXE # include —sys/socket. h> 

函数 原型 int socket(int domain. int type, int protocol) ; 
domain: 套 接 字 的 通信 域 

参数 type: 指定 套 接 字 的 类 型 
protocol; 与 该 套 接 字 一 起 使 用 的 特定 协议 

" 0. 成 功 

ilm 一 1: 失败 


domain; 又 称 为 协议 族 (family)。 常 用 的 协议 族 有 AF_INET、AF_INET6、AF_ 
LOCAL( 或 称 AF_UNIX,UNIX 域 套 接 字 ) ,AF ROUTE 等 。 协 议 族 决定 了 套 接 字 的 地 
址 类 型 ,在 通信 中 必须 采用 对 应 的 地 址 ,如 AF_INET 决定 了 要 用 IPv4 地 址 (32 位 ) 与 端 
口号 (16 位 ) 的 组 合 .AF_UNIX 决定 了 要 用 一 个 绝对 路 径 名 作为 地 址 。 

type: 指定 套 接 字 类 型 。 常 用 的 套 接 字 类 型 有 SOCK_STREAM\、SOCK_DGRAM、 
SOCK RAW,SOCK PACKET,SOCK SEQPACKET 等 。 

protocol. 用 于 指定 协议 。 常用 的 协议 有 IPPROTO |. TCP, IPPTOTO |. UDP, 
IPPROTO_SCTP、IPPROTO_TIPC 等 ,它们 分 别 对 应 TCP 传输 协议 .UDP 传输 协议 、 
STCP 传输 协议 .TIPC 传输 协议 。 

2. 绑 定 地 址 

使 用 bind 系统 调用 将 一 个 套 接 字 绑 定 到 本 地 客户 端的 一 个 地 址 上 ,使 得 客户 端 可 以 
连接 ,该 接口 规范 说 明 如 表 10. 2 所 示 。 
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表 10.2 bind 函数 的 接口 规范 说 明 


函数 名 称 bind 

函数 功能 将 一 个 套 接 字 绑 定 到 一 个 地 址 上 ,使 得 客户 端 可 以 连接 

头 文件 # include —sys/socket. h> 

函数 原型 int bind(int sockfd, const struct sockaddr * addr,socklen_t addrlen); 
sockfd: 上 一 个 socket() 系 统 调用 中 获得 的 文件 描述 符 

参数 addr: 指向 包含 绑 定 地 址 的 结构 的 指针 
addrlen: 地 址 结构 的 大 小 

" 0; 成 功 

aum 一 1: 失败 


bind 系统 调用 成 功 时 返回 0, 否 则 返回 一 1, 并 将 error 变量 设置 为 表 10. 3 中 的 值 。 
表 10.3 bind 系统 调用 返回 的 错误 代码 


Rt B 说 有 明 
EBADF 文件 描述 符 无 效 
ENOTSOCK 文件 描述 符 代表 的 不 是 一 个 套 接 字 
EINVAL 文件 描述 符 是 一 个 已 经 命名 的 套 接 字 
EADDRNOTAVAIL 地 址 不 可 用 
EADDRINUSE 地 址 已 经 绑 定 了 一 个 套 接 字 
3. 监听 请 求 


listen 系统 调用 监听 来 自 客 户 端的 套 接 字 的 连接 请 求 ,该 接口 规范 说 明 如 表 10. 4 
所 示 。 
表 10.4 listen 函数 的 接口 规范 说 明 


函数 名 称 listen 
函数 功能 在 一 个 监听 socket 上 接受 一 个 连接 ,并 返回 对 等 的 socket 地 址 
头 文件 # include — sys/socket. h> 
函数 原型 int listenCint sockfd，int backlog) ; 
参数 sockfd: 套 接 字 系统 调用 中 获得 的 文件 描述 符 

backlog: sockfd 挂 起 的 已 连接 队列 可 以 增长 的 最 大 长 度 
inis 2 


listen 系统 调用 成 功 时 返回 0, 和 否则 返回 一 1, 它 的 错误 代码 包括 EBADF, 
ENOTSOCK EINVAL ,它们 的 含义 和 bind 系统 调用 的 错误 代码 相同 。 

4. 接受 连接 

服务 器 上 的 应 用 程序 创建 好 命名 套 接 字 之 后 ,就 可 以 使 用 accept 系统 调用 来 建立 客 


E Lnx 环 境 高 级 程序 设计 


户 端 程序 对 该 套 接 字 的 连接 ,该 接口 规范 说 明 如 表 10. 5 Bron o 


表 10.5 accept 函数 的 接口 规范 说 明 


函数 名 称 accept 

函数 功能 允许 一 个 套 接 字 接收 来 自 其 他 套 接 字 的 接 入 连接 

头 文件 # include <sys/socket. h> 

函数 原型 int accept(int sockfd, struct sockaddr * addr, socklen t * addrlen); 
sockfd: socket() 系 统 调用 中 获得 的 文件 描述 符 

参数 addr: 指向 保存 连接 对 端的 地 址 , 即 客户 端的 地 址 
addrlen: 指定 地 址 结构 的 大 小 

3 0: 成 功 

main 一 1: 失败 


accept 系统 调用 等 待 有 客户 程序 试图 连接 由 套 接 字 参 数 指定 的 套 接 字 时 才 返 回 , 该 
客户 程序 就 是 套 接 字 队 列 排 在 第 一 位 的 连接 。 

5. 建立 客户 端 连接 

当 客户 想 要 连接 到 服务 器 上 时 , 它 会 尝试 在 一 个 未 命名 套 接 字 和 服务 器 的 监听 套 接 
字 之 间 建 立 一 个 连接 ,connect 系统 调用 用 于 客户 端 建立 连接 ,发 起 三 次 握手 过 程 ,该 接口 
规范 说 明 如 表 10.6 所 示 。 


表 10.6 connect 函数 的 接口 规范 说 明 


函数 名 称 connect 

函数 功能 建立 与 另 一 个 套 接 字 之 间 的 连接 

头 文件 # include 一 sys/socket. h> 

函数 原型 int connect(int sockfd, const struct sockaddr * addr,socklen_t addrlen) ; 
sockíd; socket 系统 调用 中 获得 的 文件 描述 符 

参数 addr: 指向 的 是 服务 器 的 地 址 
addrlen: 指定 地 址 结构 的 大 小 

0: 成 功 

aiiis 一 1; 失败 


connect 系统 调用 成 功 时 返回 0, 否 则 返回 一 1, 并 将 error 变量 设置 为 表 10.7 中 的 值 。 


表 10.7 connect 系统 调用 返回 的 错误 代码 


Rt B 说 M 
EBADF 文件 描述 符 无 效 
EALREADY 套 接 字 上 已 经 有 了 一 个 正在 使 用 的 连接 
ETIMEDOUT 连接 超时 


ECONNREFUSED 连接 请 求 被 服务 器 拒绝 
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如 果 连 接 不 能 立刻 建立 起 来 ,connect 系统 调用 会 阻塞 一 段 不 确定 的 倒计时 时 间 , 这 
段 倒计时 时 间 结 束 后 这 次 连接 就 会 失败 。 如 果 connect 系统 调用 时 被 一 个 信号 中 断 ,而 
这 个 信号 又 得 到 了 处 理 ,connect 还 是 会 失败 ,但 这 次 连接 尝试 是 成 功 的 , 它 会 以 异步 方式 
继续 尝试 。 


1023 套 接 字 通 信 流 程 


在 10.2.2 节 中 ,描述 了 套 接 字 编 程 的 系统 调用 接口 ,本 节 以 这 些 接口 为 例 ,描述 套 接 
字 的 通信 流程 ,也 就 是 如 何 利 用 这 些 系统 调用 完成 一 个 跨 机 器 通信 的 程序 。 

利用 套 接 字 进行 通信 的 进程 使 用 的 是 客户 端 /服务 器 模式 。 服 务 器 用 来 提供 服务 , 客 
户 端 可 以 使 用 服务 器 提供 的 服务 ,就 好 像 一 个 提供 Web 页 服务 的 服务 器 和 一 个 读 取 并 浏 
览 Web 页 的 浏览 器 。 

使 用 套 接 字 进行 通信 时 ,首先 建立 服务 器 连接 ,一 个 典型 的 服务 端 程序 建立 流程 
如 下 : 

A) 使 用 socket 系统 调用 创建 一 个 套 接 字 用 于 通信 。 

(2) 使 用 bind 系统 调用 将 上 一 步 已 经 创建 的 套 接 字 绑 定 到 一 个 众所周知 的 地 址 上 。 

(3) 使 用 listen 系统 调用 允许 套 接 字 开始 接收 其 他 套 接 字 的 连接 。 

(4) 使 用 accept 系统 调用 接收 一 个 套 接 字 连接 ,并 返回 本 地 一 个 文件 描述 符 , 该 描述 
符 后 续 用 于 和 客户 端 套 接 字 进行 通信 。 

(5) 使 用 read 和 write 系统 调用 和 客户 端 交换 数据 。 

(6) 通信 结束 之 后 使 用 close 系统 调用 关闭 套 接 字 。 

接着 是 客户 端的 流程 ,和 服务 端 相 比 ,客户 端的 流程 相对 简单 ,获取 服务 端的 地 址 之 
后 ,主动 连接 即 可 : 

(1) 使 用 socket 系统 调用 创建 一 个 套 接 字 用 于 通信 。 

(2) 使 用 connect 系统 调用 连接 已 经 启动 的 服务 端 ,connect 系统 调用 使 用 的 地 址 填 
写 服务 端的 地 址 。 

(3) 使 用 read 和 write 系统 调用 和 客户 端 交换 数据 。 

(4) 通信 结束 之 后 使 用 close 系统 调用 关闭 套 接 字 。 

套 接 字 通信 流程 如 图 10. 4 Bros. 

示例 程序 10. 1 是 上 述 过 程 的 示例 代码 ,一 个 关于 “hello world” 的 程序 ,客户 端 连接 
服务 器 之 后 发 送 “hello world" ,服务 端 收 到 之 后 显示 ,然后 再 次 将 “hello world” 返 回 给 客 
户 端 ,客户 端 收 到 之 后 显示 ,之 后 调用 close 系统 调用 关闭 套 接 字 。 


[示例 10.1- 1 exp socket server.c] 
# include< stdlib.h> 

# include< stdio.h» 

# include< string.h» 

# include« unistd.h» 

# include sys/types.h» 

# include sys/socket..h»- 


A senne 


socket() 


1 
bind() 
TCP 客 户 端 (上 位 机 ) t 
socket() listen() 
' 
1 accept() 
connect() 
阻塞 直到 有 客户 端 连 接 
L1 n 
Y ' 
[一 write) 请 求 数 据 read() 
处 理 请 求 
Lu 
à write() 
1 aui 
1 
read() read) 


gg 


pa 


图 10.4 套 接 字 通 信 流 程 图 


# includec netinet/in.h» 
# include« arpa/inet..h» 


# define BACKLOG 1 
# define MAXRECVIEN 1024 


int main (int argc, char * argv[]) 


i 


char buf [MAXRECVIEN] ; 
int listenfd, connectfd; 
struct sockaddr in server; 
struct sockaddr in client; 
socklen t addrlen; 


// 将 下 和 FORT 保 存 
char * ip-argv[1]; 

int port- atoi (argv[2]) ; 
if (argc!- 3) 

t 


ERF 
// 服 务 端 地 址 信息 
/客户 端 地 址 信息 


printf ("argument error, please input ip and portAn") ; 


exit (1); 
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$ 
/创建 套 接 字 
if ((istenfd- socket(AF INET, SOCK SIREAM, 0))-—- 1) 
t 
perror("socket() error. Failed to initiate a socket"); 
exit (1); 
) 
bzero(&server, sizeof (server)); 
server.sin family-AF INET; 
server.sin port- htons (port); 
inet pton(AF INET, ip, &server.sin addr); 
/将 地 址 和 套 接 字 绑 定 
if (bind(listenfd, (struct sockaddr * ) &server, sizeof (server))-- - 1) 
t 
perror ("Bind() error."); 
exit(1); 
) 
/开始 监听 连接 
if (listen(listenfd, BACKIOG)-— - 1) 
t 
perror ("listen() error. Xn"); 
exit(1); 
) 
// 接 收 连接 
addrlen- sizeof (client); 
if ((connectfd- accept (listenfd, (struct sockaddr * ) &client, 


Perror ("accept () error. Wn"); 
exit(1); 
$ 
bzero (buf, MAXRECVIEN) ; 
int ret- recv (connectfd, buf, MAXRECVIEN, 0); 
if (re> O) 
printf ("$s", buf); 
else 
close (connectfd) ; 
send(connectfd, buf, ret, 0); // 回 复 客户 端 消息 
close (listenfd); // 关 闭 套 接 字 
return 0; 
} 


[示例 10.1- 2 ep socket client.c] 
# includec stdio.h> 
# includec stdlib.h» 


int main (int argc, char * argv[]) 


{ 


int sockfd; // 套 接 字 
int num; // 接 受 发 送 数据 的 大 小 
char buf [MAXDATASTZE] ; // 缓 冲 区 


struct sockaddr in server; 


char * ip-argv[1]; 
int port- atoi (argv [2]); 


if (argct- 3) 

f 
printf ("argument error, please input ip and port\n"); 
exit(1); 


// 创 建 socket 
if ((sockfd- socket(AF INET, SOCK STREAM, 0)) ==-1) 
t 

printf("socket() errorWn") ; 

exit (1); 


bzero (&server, sizeof (server)); 
server.sin family=AF INET; 

server.sin port- htons (port); 

inet pton(AF INET, ip, &server.sin addr); 


// 连 接 服务 器 地 址 


if (connect(sockfd, (struct sockaddr * ) &server, sizeof (server))- 


i 
printf ("connect () error\n"); 
exit (1); 


/存储 记 和 端口 的 结构 体 


-1) 
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char * str= "hello worldÀn"; 
// 发 送 数据 
if ((num- send(sockfd, str, strlen(str), 0))==- 1) 
t 
printf("send() error Wn") ; 
exit (1); 
) 
if ((num- recv (sockfd, buf, MAXDATASIZE, 0))-—- 1) 
f 
printf("recv() errorWn") ; 
exit(1); 
) 
buf [num - 1] = 'N0'; 
printf ("recv message: $sWn", buf); 
close (sockfd) ; 
return 0; 
} 


编译 程序 程序 后 运行 ,结果 如 下 : 


rootGubuntu:- # goc exp socket server.c - o server // 编 译 服 务 端 程序 
root@ubuntu:~  goc exp socket client.c - o client // 编 译 客户 端 程序 


root@ubuntu:~ # ./server 127.0.0.1 8888 // 运 行 服务 端 程序 
root@ubuntu:~ # ./client 127.0.0.1 8888 // 运 行 客户 端 程序 
服务 端的 输出 结果 如 下 : 

> hello world 

客户 端的 输出 结果 如 下 : 


> recv message: hello world 


从 运行 结果 可 以 看 出 ,示例 程序 10. 1 中 服务 端 和 客户 端 均 输出 了 “hello world" , f£ 
序 运行 正确 。 


10.3 RFE 


1031 套 接 字 地 址 结构 


大 多 数 套 接 字 函数 都 需要 一 个 指向 套 接 字 地 址 结构 的 指针 作为 参数 ,例如 系统 调用 
bind 的 第 二 个 参数 ,指向 一 个 名 为 sockaddr 的 结构 体 。 在 介绍 sockaddr 之 前 ,首先 来 看 
sockaddr in 结构 体 ,可 以 看 到 前 面 的 示例 程序 中 使 用 的 也 是 sockaddr_in 结构 体 ,它们 的 
关系 本 节 最 后 解释 。sockaddr_in 结构 体 如 下 所 示 ( 展 示 的 是 IP 套 接 字 地 址 ,可 以 执行 
Shell 命令 ,使 用 man 7 ip 命令 查看 ): 


sa family t sin family; // 地 址 协议 
in port t sin port; // 网 络 字 节 序 的 端口 
struct in adir sin addr; // 网 络 地 址 


sin. family 表示 使 用 的 网 络 协议 ,IP 套 接 字 中 必须 设置 为 AF_INET,sa_family_t 
类 型 是 任意 无 符号 整数 类 型 。 

sin. port 表示 端口 号 ,需要 注意 的 是 网 络 字 节 序 ,为 大 端 字 节 序 。in_port_t 是 一 
个 至 少 为 16 位 的 无 符号 整数 。 

sin_addr 表示 网 络 地 址 , 它 是 一 个 名 为 in_addr 的 结构 体 类 型 ,实际 上 地 址 被 转换 
成 了 uint32 t 类 型 存储 。 


struct in adir 
t 

uint32 t s addr; // 网 络 字 节 序 的 地 址 
5 
当 作 为 一 个 参数 传递 进 任意 一 个 套 接 字 函 数 时 , 套 接 字 地 址 结构 总 是 以 指针 形式 来 
传递 ,然而 以 这 样 的 指针 作为 参数 之 一 的 所 有 套 接 字 函 数 都 必须 处 理 来 自 所 支持 的 任何 
协议 族 的 套 接 字 地 址 结构 。 为 了 表示 兼容 ,就 定义 了 sockaddr 结构 体 来 表示 一 个 通用 结 
构 , 它 的 结构 如 下 所 示 : 


struct sockaddr 
{ 
uint8 t sa len; 
sa family t sa family; 
char sa data[14]; // 将 ip Hl port 表 示 在 一 起 
} 
使 用 时 需要 将 sockaddr_in 强制 类 型 转换 成 sockaddr 类 型 ,例如 可 以 使 用 下 面 的 方 
式 调用 bind ŽC: 


bind(listenfd, (struct sockaddr * ) & 服 务 器 ,sizeof 服务 器 )); 


因此 ,sockaddr 和 sockaddr_in 的 关系 是 : sockaddr 是 通用 的 标准 定义 ,而 sockaddr_in 是 
IP 协议 实现 的 ,通常 需要 将 sockaddr_in 转换 成 sockaddr 传递 给 某 些 网 络 编程 的 函数 。 

使 用 这 个 地 址 结构 要 注意 : 

* 结构 sockaddr_in 中 的 TCP 或 UDP 端口 号 都 是 以 网 络 字 节 顺序 存储 的 。 

* 32 位 的 IP 地 址 可 以 用 两 种 不 同 的 方法 引用 。 例 如 ,假设 定义 变量 server addr 为 
Internet 套 接 字 地 址 结构 ,那么 可 以 用 server addr. sin_addr 3X server addr. sin_ 
addr. s_addr 来 引用 这 个 IP 地 址 ,需要 注意 的 是 前 一 种 引用 是 结构 类 型 (struct 
in_addr) 的 数据 ,而 后 一 种 引用 是 整数 类 型 (unsigned long) 的 数据 。 
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* 当 将 IP 地 址 作为 函数 参数 使 用 时 ,需要 明确 使 用 哪 种 类 型 的 数据 ,因为 编译 器 对 
结构 类 型 参数 和 整数 类 型 参数 的 处 理 方式 不 一 样 。 

in zero 成 员 未 被 使 用 , 它 是 为 了 和 通用 套 接 字 地 址 (struct sockaddr) 保 持 一 致 而 
引入 的 。 在 编程 时 ,一 般 将 它 设置 为 0。 通常 的 做 法 是 在 填充 结构 sockaddr_in 
的 内 容 之 前 将 整个 结构 变量 清 零 。 

套 接 字 地 址 结构 仅 供 本 机 TCP 协议 记录 套 接 字 信 息 而 用 ,这 个 结构 变量 本 身 是 
不 在 网 络 上 传输 的 。 但 是 它 的 某 些 内 容 , 如 IP 址 和 端口 号 是 在 网 络 上 传输 的 ,这 
也 是 为 什么 这 两 部 分 数据 需要 转换 成 网 络 字 节 顺序 的 原因 。 


1032 字 节 顺序 


在 10.3.1 节 中 ,sockaddr_in 结构 体 中 对 于 端口 号 的 定义 采用 的 是 网 络 字 节 序 ,那么 
什么 是 字 节 序 , 以 及 它 在 套 接 字 编程 中 起 什么 作用 ? 

例如 ,有 一 个 2 字 节 整数 0x1234, 内 存 中 存储 这 两 个 字 节 有 两 种 方法 : 一 种 是 将 低 序 
字 节 存储 在 起 始 地 址 , 称 为 小 端 (little-endian) 字 节 序 , 另 一 种 是 将 高 序 字 节 存 储 在 起 始 
地 址 , 称 为 大 端 (big-endian) 字 节 序 。 字 节 序 如 图 10. 5 所 示 。 


0x12 0x34 
大 端 法 
低地 址 高 地 址 
0x34 0x12 
小 端 法 
低地 址 一 高 地 址 
图 10.5 字 节 序 


在 图 10. 5 中 ,标明 内 存 地 址 增长 方向 从 左 向 右 。 对 于 0x1234 来 说 ,0x34 是 低 字 节 ， 
0x12 是 高 字 节 ,也 就 是 大 端 模式 下 ,高 字 节 存储 在 低位 地 址 , 即 起 始 地 址 ,而 小 端 模式 下 ， 
高 字 节 存储 在 高 位 地 址 。 

示例 程序 10. 2 演示 了 如 何 判断 自己 的 主机 是 大 端 字 节 序 还 是 小 端 字 节 序 。 


[示例 程序 10.2 exp. order.c] 
# include stdio.h» 


int main(int argc, char * argv[]) 
t 
short a= 0x1234; 
char* br (char * )&a; // 将 a 的 首 地 址 强制 类 型 转换 为 char * 
if (* b==0x12) 
printf ("Big Endian\n"); 
else 
printf ("Little EndianWn") ; 
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retum 0; 
H 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 s 

root@ukuntu:~ # ./exp order 

Little Endian 

从 程序 运行 结果 可 以 得 知 ,测试 主机 的 字 节 序 为 小 端 字 节 序 。 
1033 字 节 处 理 函 数 


不 同 CPU 保存 和 解析 数据 的 方式 不 同 ( 主 流 的 Intel 系列 CPU 为 小 端 字 节 序 ) 。 显 
然 小 端 字 节 序 系统 和 大 端 字 节 序 系统 通信 时 会 发 生 数据 解析 错误 ,因此 在 网 络 编程 中 ,发 
送 数 据 前 要 将 数据 转换 为 统一 的 格式 一 一 网 络 字 节 序 (Network Byte Order) ,网 络 字 节 
序 统一 为 大 端 字 节 序 。 

例如 ,在 一 个 TCP 分 节 中 ,有 一 个 16 位 端口 号 和 一 个 32 位 的 IPv4 地 址 ,发 送 协议 
栈 和 接收 协议 栈 必 须 对 此 多 字 节 字段 的 传送 字 节 序 进行 协调 ,以 达成 一 致 ,否则 路 由 可 能 
出 现 问题 。 

通常 使 用 以 下 4 个 函数 来 完成 端口 地 址 从 网 络 字 节 序 和 主机 字 节 序 的 互相 转化 : 


# include< arpa/inet.h» 


uint32 t htonl(uint32 t hostlong); 

uintlé t htons (uint16 t hostshort); 

uint32 t ntchl(uint32 t netlong); 

uintlé t ntchs(uintl6 t netshort); 

在 这 些 函 数 名 中 ,h 代表 host. n 代表 network.s 代表 short. 1 代表 long。 使 用 这 些 
函数 时 ,不 需要 关心 主机 字 节 序 和 网 络 字 节 序 的 真实 值 (大 端 字 节 序 或 者 小 端 字 节 序 ) ,只 
需 调用 适当 的 函数 在 主机 和 网 络 字 节 序 之 间 转 换 某 个 给 定 值 。 

除 以 上 转换 端口 的 函数 外 ,还 需要 将 字符 串 转 换 成 网 络 字 节 序 ,完成 点 分 十 进 制 IP 
地 址 与 二 进 制 IP 地 址 之 间 的 相互 转换 ,这 时 需要 使 用 以 下 函数 : 

# include< sys/socket.h» 

# include< netinet/in.h» 

# includec arpa/inet..h> 


int inet aton(const char * cp, struct in addr * imp); 

char * inet ntoa(struct in addr in); 

inet aton 函数 将 第 一 个 参数 cp 指向 的 字符 串 转 换 成 一 个 32 位 的 网 络 字 节 序 二 进 
制 值 ,并 且 通 过 第 二 个 参数 指针 inp 来 保存 。 

inet_ntoa 函数 将 一 个 32 位 的 网 络 字 节 序 二 进 制 IPv4 地 址 转换 成 相应 的 十 进 制 数 
串 。 由 该 函数 的 返回 值 所 指向 的 字符 串 驻 留 在 静态 内 存 中 。 
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1041 基于 TCP 协 议 的 网 络 通信 
send 和 recv 这 两 个 函数 用 于 在 面向 连接 的 套 接 字 上 进行 传输 。 


1. 发 送 数据 


面向 连接 的 TCP 发 送 数据 时 使 用 send 函数 ,该 函数 接口 规范 说 明 如 表 10. 8 所 示 。 


表 10.8 send 函数 的 接口 规范 说 明 


函数 名 称 send 
函数 功能 向 TCP 连接 的 另 一 端 发 送 数据 
# include — sys/types. h> 
Exe # include —sys/socket. h> 
函数 原型 int send(int sockfd，const void * buf, size t len, int flags) ; 
sockíd: 指定 发 送 端 套 接 字 描述 符 
参数 buf; 指向 发 送 数据 的 指针 
len: 数据 的 长 度 
flags: 一 般 置 0 
实际 发 送 的 字 节 数 : 成 功 
返回 值 一 1; 失败 


注意 : 在 UNIX 系统 下 ,如 果 send 函数 在 等 待 协议 传送 数据 时 网 络 断 开 的 话 , 调 用 
send 的 进程 会 接收 到 一 个 SIGPIPE 信号 ,进程 对 该 信号 的 默认 处 理 是 进程 终止 。 


2. 接收 数据 


面向 连接 的 TCP 接收 数据 时 使 用 recv 函数 ,该 函数 的 接口 规范 说 明 如 表 10. 9 所 示 。 


表 10.9 — recv 函数 的 接口 规范 说 明 


函数 名 称 recv 
函数 功能 从 TCP 连接 的 另 一 端 接收 数据 
# include —sys/types. h> 
头 文件 # include — sys/socket. h> 
函数 原型 int recv(int sockfd, void * buf, size t len, int flags); 
sockfd: 指定 发 送 端 套 接 字 描述 符 
参数 buf: 要 读 取信 息 的 缓冲 
len: 缓冲 的 最 大 长 度 
flags: 一 般 置 0 
实际 读 入 缓冲 区 的 字 节 数 : 成 功 
ai 一 1, 失败 


示例 程序 10. 3 基于 TCP 网 络 通信 实现 ,程序 分 为 服务 端 和 客户 端 两 部 分 ,客户 端 连 
接 服务 器 后 从 标准 输入 读 取 输 入 的 字符 ,发 送 给 服务 器 ,服务 器 接收 到 字符 串 后 ,又 重新 
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发 送 给 客户 端 ,客户 端 将 消息 打印 到 标准 输出 。 


[示例 程序 10.3- 1 exp tœ server.c] 
# include< sys/types.h> 
# include< sys/socket.h> 
# include< netinet/in.h» 
# include< arpa/inet.h» 
# include« unistd.h» 

# include< stdlib.h» 

# include< stdio.h» 

# includec string.h» 

# include netdb.h» 

# include« ermo.h» 


# define FORT 2345 
# define MAXSIZE 1024 


int main(int argc, char * argv[]) 
t 
int sockfd, newsockfd; 


struct sockaddr in server air; // 定 义 服务 端 套 接口 数据 结构 
struct sockaddr in client adir; /定义 客户 端 套 接口 数据 结构 
int sin zise, portnmber; 

char buf [MAXSIZE] ; /人 发 送 数据 缓冲 区 


int addr len- sizeof (struct sockaddr in); 

if ((sockfd- socket(AF INET, SOCK STRERM 0)) < 0) 

t 
fprintf (stderr, "create socket failedWn"); 
exit(EXIT FAILURE); 

) 

puts("create socket success"); 

printf ("sockfd is $dWn", sockfd); 


// 清 空 表示 地 址 的 结构 体 变量 
bzero(&server addr, sizeof (struct sockaddr in)); 
// 设 置 acar 的 成 员 变 量 信息 

server addr.sin family-AF INET; 

server addr.sin port- htons (FORT) ; 

// 设 置 让 为 本 机 下 

server addr.sin addr.s addr- htonl (INADDR ANY); 
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if (bind(sockfd, (struct sockaddr* ) (&server addr), 
sizeof (struct sockaddr)) < 0) 


fprintf (stderr, "bind failed Wn"); 
exit(EXIT FAILURE); 


puts ("bind success Wn") ; 


if (listen(sockfd, 10) « 0) 
f 
perror ("listen fail\n"); 
exit (EXIT FAILURE); 


puts ("listen successWn") ; 


int sin size sizeof (struct sockaddr in); 

printf ("sin size is $dWn", sin size); 

if ((newsockfd- acoept(sockfd, (struct sockaddr * )(&client addr), 
&sin size)) <0) 


perror ("acoept error"); 
exit(EXIT FAILURE); 


printf ("acoepted a new connectionNn") ; 

printf ("new socket id is $dWMn", newsockfd) ; 

printf ("Accept client ip is $s\n", inet ntoa(client addr.sin addr)); 
printf ("Connect successful please input message Wn") ; 


char sendouf [1024] ; 
char mybuf [1024] ; 


while (1) 
t 
int len- recv (newsockfd, buf, sizeof (buf), 0); 
if (stramp(buf, "exit\n")==0) 
break; 
fputs (buf, stdout); 
Send (newsockfd, buf, len, 0); 
memset (sendbuf, 0 ,sizeof (sendbuf)); 
memset (buf, 0, sizeof (buf)); 
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[示例 程序 10.3- 2 exp tcp client.c] 
# include< stdio.h» 

# include< unistd.h» 

# include< stdlib.h> 

# include< sys/types.h» 

# include< sys/socket.h» 

# include< netinet/in.h> 

# include< netdb.h> 

# include< string.h> 

# include< ermo.h> 


# define FORT 2345 
int count- 1; 


int main () 
{ 
int sockfd; 
char buffer[2014]; 
struct sockaddr in server addr; 
struct hostent * host; 
int nbytes; 
if ((sockfd-socket(AF INET, SOCK STREAM, 0)) ==- 1) 
t 
fprintf (stderr, "Socket Error is %s\n", strerror (errno)); 
exit(EXIT FAILUFE) ; 
) 
bzero(&server addr, sizeof (server addr)); 
server addr.sin family =AF INET; 
server addr.sin port =htons (PORT) ; 
server addr.sin addr.s addr - htonl(INADPR ANY); 
/客户 端 发 出 请 求 


if (connect(sockfd, (struct sockaddr * ) (&server addr), 


sizeof (struct sockaddr)) ==- 1) 


fprintf (stderr, "Connect failed\n"); 


exit (EXIT_FATIIFE); 


char sendbuf [1024]; 


char recvbuf [2014]; 


while (1) 
t 


fgets(sendbuf, sizeof (sendbuf), stdin); 
send(sockfd, sendouf, strlen(sendbuf), 0); 


if (stram(: , "exit\n") ==0) 
break; 


recv(sockfd, recvbuf, sizeof (recvbuf), 0); 


fputs (recvbuf, stdout); 
memset (sendbuf, 0, sizeof (sendbuf)) ; 
memset (recvbuf, 0, sizeof (recvbuf)  ; 


close (sockfd) ; 
exit(EXIT SUCCESS); 
retum 0; 

) 


编译 后 运行 ,得 到 程序 的 运行 结果 如 下 : 


客户 端 : 

root@ubuntu:~ # goc exp tcp client.c -o client 
rootGubuntu:^ # ./client 

Hello, Linux! 输入 ) 

Hello,Linux! 

服务 端 : 

root@ubuntu:~ # goc exp tcp server.c -o server 
root@ubuntu:~ # ./server 


Acospt client ip is 127.0.0.1 
Hello, Lin! 
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// 编 译 客户 端 程序 


// 编 译 服务 器 端 程序 
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sendto 和 recvfrom 函数 用 于 在 无 连接 的 数据 包 套 接 字 方式 下 进行 数据 的 传输 。 由 
于 本 地 套 接 字 没 有 与 远程 机 器 建立 连接 ,因此 在 发 送 数据 时 应 指明 目的 地 址 。 


1. 发 送 数 据 
面向 无 连接 的 UDP 发 送 数据 时 使 用 sendto 函数 ,该 函数 的 接口 规范 说 明 如 表 10. 10 
所 示 。 
表 10.10 sendto 函数 的 接口 规范 说 明 
函数 名 称 sendto 
函数 功能 向 UDP 连接 的 另 一 端 发 送 数据 
# include —sys/types. h> 
头 文件 # include —sys/socket. h> 
int sendtoCint sockfd, const void * buf, int len, int flags, const struct sockaddr 
mE * dest addr, socklen t addrlen) ; 
sockíd: 指定 发 送 端 套 接 字 描述 符 
buf: 指向 发 送 数据 的 指针 
len: 数据 的 长 度 
参数 flags: 一 般 置 0 
dest_addr: struct sockaddr 类 型 变量 目的 机 的 IP 地 址 和 端口 号 信息 
addrlen; 内 存 区 的 地 址 长 度 ,一 般 为 sizeof(struct sockaddr_in) 
" 实际 发 送 的 字 节 数 : 成 功 
ERE 。 | 一 1, 失败 
2. 接收 数据 


面向 无 连接 的 UDP 接收 数据 时 使 用 recvfrom O 函数 ,该 函数 的 接口 规范 说 明 如 


X 10. 11 所 示 。 


表 10.11 recvfrom 函数 的 接口 规范 说 明 


函数 名 称 recvírom 
函数 功能 从 UDP 连接 的 另 一 端 接收 数据 
# include <sys/types. h> 
头 文件 # include — sys/socket. h> 
int recvfrom(int sockfd, void * buf, int len, int flags, struct sockaddr * src addr, 
SENS socklen t * addrlen) ; 
sockfd: 指定 接收 端 套 接 字 描述 符 
buf: 要 读 取信 息 的 缓冲 
len: 缓冲 的 最 大 长 度 
参数 flags: 一 般 置 0 
src_addr: struct sockaddr 类 型 的 变量 ,保存 源 机 的 IP 地 址 和 端口 号 
addrlen: 实际 存 取 src_addr 的 数据 字 节 数 
返回 什 实际 发 送 的 字 节 数 : 成 功 


一 1: 失败 
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示例 程序 10.4 基于 UDP 网 络 通信 实现 ,程序 分 为 服务 端 和 客户 端 。 客 户 端 连接 从 
标准 输入 读 取 输入 的 字符 ,发送 给 服务 器 ,服务 器 接收 到 字符 串 后 ,又 重新 发 送 给 客户 端 ， 
客户 端 将 消息 打印 到 标准 输出 。 


[示例 程序 10.4- 1 exp udp server.c] 
# include sys/types.h» 
# include< sys/socket.h» 
# include« netinet/in.h» 
# include< arpa/inet.h» 
# includec unistd.h» 

# includec stdlib.h> 

# includec stdio.h> 

# include string.h> 

# include< netdb.h> 

# include< ermo.h> 


# define FORT 8888 
# define MX MSG SIZE 1024 


int main (void) 
t 
int sockfd, addrlen, n; 
struct sockaddr in addr; 
char msg[MAX MSG SIZE]; 
sockfd- socket(AF INET, SOCK DGRAM, 0); 
if (sockfd « 0) 
t 
fprintf (stderr, "socket failedWn"); 
exit(EXIT FAILURE) ; 
) 
addrlen- sizeof (struct sockaddr in); 
bzero(&addr, addrlen); 
addr.sin family- AF INET; 
addr.sin addr.s addr- htonl(INADDR ANY); 
addr.sin port- htons (FORT) ; 
if (bind(sockfd, (struct sockaddr * ) (&addr), addrlen) « 0) 
t 
fprintf (stderr, "bind fail\n"); 
exit(EXIT FAIIURE); 
) 
puts ("bind success") ; 
while (1) 
{ 
bzero(msg, MAX MSG SIZE); 
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rr recvfram(sockfd, msg, sizeof (msg), 0, (struct sockaddr * ) (saddr), 
&adtrlen) 
fprintf (stdout, "Recevie message fram client is %s\n", msg); 
sendto(sockfd, msg, n, 0, (struct sockaddr * ) (gaddr), addrlen); 
H 
close (sockfd) ; 
exit(EXIT SUCCESS); 


[示例 程序 10.42 exp udp client.c] 
# includec stdio.h> 

# include unistd.h» 

# includec stdlib.h> 

# includec sys/types.h» 

# include< sys/socket.h» 

# include< netinet/in.h» 

# include< string.h» 


# define MAX BUF SIZE 1004 
# define FORT 8888 


int main() 
t 
int sockfd, addrlen, n; 
char buffer MAX BUF SIZE]; 
struct sockaddr in addr; 
sockfd-socket(AF INET, SOCK DERAM, 0); 


if (sockfd « 0) 

t 
fprintf (stderr, "socket faliedWn"); 
exit(EXIT FATIURE); 


addrlen- sizeof (struct sockaddr in); 
bzero(&addr, addrlen); 

addr.sin family- AF INET; 

addr.sin port- htons (FORT) ; 

addr.sin addr.s addr- htonl(INADDR ANY); 


puts ("socket success"); 
while(1) 
{ 

bzero (puffer, MAX BUF SIZE); 
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fgets(buffer, MAX BUF SIZE, stdin); 


sendto(sockfd, buffer, strlen(buffer), 0, (struct sodkedir * ) (sadir), 
addrlen); 
printf ("client send msg is &sWn", buffer); 
n- recv£ran(sockfd, buffer, strlen (buffer), 0, 
(struct sockaddr * ) (&addr), &addrlen); 
fprintf (stdout, "client Receive message from server is %s\n", buffer); 


客户 端 : 

root@ubuntu:~ #goc exp udp client.c- o client ”// 编 译 客户 端 程序 
root@ubuntu:~ # ./client 

socket success 

Hello, Linux! 

client send msg is wxyG linux 

client Receive message frm server is  Hello,Linux! 

服务 端 : 

root@ubuntu:~ # gcc exp tcp _ server.c -o server // 编 译 服 务 器 端 程序 
root@ubuntu:~ # ./server 

Bind success 

Receive message frm client is Hello, Linux! 


10.5 小 结 


Linux 操作 系统 之 所 以 能 广泛 应 用 的 一 个 主要 原因 是 其 卓越 的 网 络 应 用 ,网 络 编程 
是 Linux 应 用 一 个 很 重要 的 方面 。 本 章 介绍 了 TCP UDP 网 络 编程 的 基础 知识 ,首先 对 
TCP/IP 参考 模型 各 层 的 功能 进行 了 阐述 ,接着 对 socket, bind, listen, accept, connect 等 
系统 调用 以 及 字 节 序 处 理 等 其 他 套 接 字 操 作 函 数 一 一 进行 了 详细 介绍 ,其 中 服务 器 的 程 
序 设计 需要 依次 调用 socket, bind, listen, accept, close 函数 ,客户 端 程序 设计 依次 调用 
socket,connect,close 函数 。 最 后 通过 两 个 示例 对 TCP, UDP 网 络 编程 的 流程 进行 了 验 
证 ,向 读者 展示 了 简单 的 网 络 编程 应 用 。 


习 题 


一 、 填空 题 
1. 整数 0x3721 在 小 端 字 节 序 方式 下 , 按 地 址 从 低 到 高 ,内 存 中 存放 的 是 è 
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2. TCP/IP 协议 参考 模型 共 分 为 四 层 , 分 别 是 x 


3. 套 接 字 定义 了 一 中 可 靠 的 面向 连接 的 服务 ,实现 了 无 差错 无 重复 的 顺序 
数据 传输 。 套 接 字 顶 一 个 一 种 无 连接 的 服务 ,数据 通过 相互 独立 的 报 文 进行 
传输 。 

4. FTP 属于 层 协 议 ,TCP 属于 层 协 议 。 

5. 要 在 数据 报 套 接 字 上 发 送 和 接收 数据 ,需要 使 用 和 函数 。 

二 、 编 程 题 

1. 编写 一 个 客户 端 程序 ,使 它 能 够 连接 到 一 个 Web 服务 器 ,请 求 一 个 文档 ,然后 显 
示 结 果 。 

2. 编写 一 个 套 接 字 程序 ,要 求 服务 器 等 待 客户 的 连接 请 求 ,一 旦 有 客户 连接 ,服务 器 
打印 出 客户 端的 TP 地 址 和 端口 ,并 向 服务 器 发 送 欢迎 信息 。 

3. 编写 一 个 基于 TCP 协议 的 网 络 通信 程序 ,要 求 服务 器 通过 套 接 字 连 接 后 ,要 求 输 
入 用 户 名 ,判断 用 户 名 正确 后 ,向 客户 端 发 送 连接 正确 的 字符 串 ,在 服务 器 显示 客户 端的 
IP 地 址 和 端口 。 


prm 


实验 1 Linux 基础 知识 


Linux 为 用 户 提供 了 丰富 的 字符 接口 , 即 Shell 命令 。 对 普通 用 户 来 讲 , 熟 悉 常 用 的 
Shell 命令 可 以 更 为 方便 地 使 用 Linux 系统 ;对 程序 员 来 说 ,经 常会 使 用 Shell 命令 所 提供 
的 工具 以 及 性 能 检测 工具 辅助 程序 的 编写 和 运行 ,Linux Shell 命令 是 编程 的 基础 。 

一 、 实 验 目 的 

1. 熟悉 Linux 环境 。 

2. 掌握 Linux Shell 的 常用 命令 。 

二 、 实 验 内 容 

1. 通过 Shell 命令 查看 Linux 系统 的 商业 版 本 和 内 核 版 本 , 列 出 “/ "目录 下 第 一 级 目 
录 及 文件 的 名 称 并 大 致 说 明 这 些 目录 和 文件 的 作用 。 

2. 通过 Shell 命令 查看 网 络 的 当前 配置 信息 ,并 写 出 网 址 、 掩 码 、 网 关 、DNS 的 配置 
信息 ,以 及 当前 网 络 接收 数据 包 和 发 送 数据 包 的 情况 。 

3. 通过 Shell 命令 检测 网 络 当 前 是 否 连通 ,并 写 出 检测 结果 。 

4. 通过 Shell 命令 显示 当前 用 户 的 工作 目录 。 

5. 通过 Shell 命令 从 当前 目录 跳 转 到 指定 目录 “/usr/include” 下 ,并 查看 目录 下 所 有 
文件 及 目录 的 详细 信息 。 描 述 math. h 文件 的 大 小 ,创建 日 期 .创建 者 及 使 用 权限 。 

6. 查看 /etc/passwd 文件 的 内 容 。 

7. 通过 man 命令 了 解 top \iostat \sar free, ps 命令 的 使 用 方法 ,并 写 出 命令 的 功能 、 

8. 使 用 top iostat sar, free ps 命令 查看 系统 性 能 ,并 写 出 运行 结果 及 含义 。 


实验 2 C 程序 开发 工具 


Linux 下 的 高 级 编程 需要 熟悉 编辑 .编译 和 调试 程序 的 工具 ,vim .gcc 和 gdb 分 别 是 
Linux 下 使 用 非常 广泛 的 编辑 .编译 和 调试 程序 工具 ,掌握 vim. gcc 和 gdb 的 使 用 是 
Linux 下 高 级 编程 的 基础 。 当 编写 的 是 一 个 项 目 , 包 含 文件 较 多 时 ,make 工具 支持 多 文 
件 的 复杂 编译 ,通过 执行 Makefile 文件 可 以 实现 复杂 项 目的 编译 工作 ,并 提高 编译 的 
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一 、 实 验 目的 
. 掌握 vim 的 使 用 。 
. FIR gcc 的 使 用 。 
. 掌握 gdb 中 设置 断 点 以 及 观察 程序 中 变量 值 的 方法 。 
. 掌握 基本 的 Makefile 文件 编写 规则 ,使 用 make 工具 实现 多 文件 的 编译 。 

二 、 实验 内 容 

1. vim 的 练习 。 

CD 请 在 “/tmp” 这 个 目录 下 新 建 一 个 名 为 vimtest 的 目录 。 

(2) 进入 vimtest 这 个 目录 当中 。 

(3) 将 “/etc/passwd” 复 制 到 当前 目录 下 。 

(4) 使 用 vim 打开 当前 目录 下 的 “/etc/passwd” 文 件 。 

(5) 在 vim 中 设置 行 号 。 

(6) 移动 到 第 10 行 ,向 右 移动 5 个 字符 ,请 问 你 看 到 的 内 容 是 什么 ? 

(7) 移动 到 第 1 行 ,并 且 向 下 查找 "sys” 字 符 串 ,请 问 它 在 第 几 行 ? 

(8) 接 下 来 ,将 1 到 5 行 间 的 “: " 改 为 "#”, 并 且 逐 个 挑选 是 否 需 要 修改 ,如 何 执行 命 
令 ? 如 果 在 挑选 过 程 中 一 直 按 *y”, 结 果 会 在 最 后 一 行 出 现 改变 几 个 :? 呢 ? 

(9) 修改 完 之 后 ,要 全 部 复原 ,有 哪些 办 法 ? 

(10) 复制 5 一 10 这 6 行 的 内 容 ,并 且 粘 贴 到 最 后 一 行 之 后 。 

(11) 将 这 个 文件 另存 为 passwdtest。 

(12) 删除 第 8 行 的 前 15 个 字符 ,结果 出 现 的 第 一 个 字符 是 什么 ? 

(13) 在 第 1 行 新 增 一 行 ,该 行内 容 为 *I am a student," 

(14) 保存 后 退出 。 

2. 编写 一 求 n 阶乘 的 C 语言 文件 ,使 用 gcc 工具 编译 该 源 程序 并 运行 。 

3. 对 第 2 题 中 求 n 阶乘 文件 设置 断 点 ,使 用 gdb 工具 观察 该 程序 的 递归 调用 过 程 ， 
并 观察 n 的 值 。 

4. 编写 一 个 C 语言 项 目 , 其 源 代 码 中 包含 有 两 个 头 文件 和 三 个 C 语言 源 文件 ,要求 
用 户 编写 Makefile 脚本 ,将 这 些 文件 共同 编译 为 可 执行 程序 。 


实验 3 文件 LO 操作 


信息 对 大 多 数 操作 系统 来 讲 ,是 以 文件 形式 存放 的 , 绝 大 多 数 用 户 接触 系统 ,首先 也 
是 从 访问 文件 开始 ,因此 熟悉 Linux 中 对 文件 的 常用 操作 方法 是 Linux 高 级 编程 的 一 个 
重要 内 容 。 

一 、 实 验 目的 

1. 熟悉 常用 的 文件 操作 函数 open close, read, write 和 lseek 等 的 使 用 。 

2. 熟悉 对 文件 各 种 属性 值 的 访问 及 文件 目录 的 遍历 的 方法 。 

二 、 实 验 内 容 

1. 编写 一 个 复制 文件 的 程序 ,可 以 将 Linux 系统 中 任意 路 径 下 的 指定 文件 或 目录 复 
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制 到 目的 路 径 下 。 

2. 参考 3. 6 节 完 成 一 个 简化 版 的 Linux Shell 命令 ls,ls 支持 -a -1 -R 选项 。-a 功能 
表示 列 出 全 部 文件 ,连同 隐藏 文件 (开头 为 . 的 文件 ) ;-] 功能 表示 列 出 文件 的 长 格式 信息 ， 
包括 文件 的 类 型 和 访问 权限 、 文 件 的 链接 数 、 文 件 所 有 者 、 文 件 所 有 者 所 属 的 组 ,文件 大 
小 .文件 创建 时 间 等 ;-R 功能 表 递 归 地 列 出 目录 中 所 有 的 文件 包含 子 目 录 中 的 文件 。 


实验 4 进程 管理 及 守护 进程 


进程 是 操作 系统 中 最 重要 的 概念 ,程序 是 指令 .数据 及 其 组 织 形式 的 描述 ,进程 是 程 
序 的 实例 。 掌 握 进程 的 控制 是 Linux 环境 下 编程 不 可 或 缺 的 基本 要 求 。 

一 、 实 验 目的 

1. 掌握 常用 的 进程 控制 命令 ,如 ps. pstree.top 等 。 

2. 掌握 进程 管理 过 程 中 的 常用 系统 调用 ,包括 fork eXec 族 exit, wait 等 函数 。 

3. 熟悉 kill 命令 system 函数 等 与 进程 相关 的 命令 或 函数 。 

4. 掌握 僵尸 进程 和 孤儿 进程 产生 的 原因 ,能 画 出 程序 所 产生 的 进程 结构 树 。 

5. 掌握 守护 进程 的 编写 要 点 ,能够 仿 写 出 守护 进程 。 

二 、 实 验 内 容 

1. 在 Shell 环境 下 使 用 进程 常用 命令 : ps.pstree, topat, kill 等 ,记录 命令 的 运行 
2. 编写 一 个 程序 ,在 主 进程 中 创建 一 个 子 进程 , 子 进程 输出 “This is the child 
process1”, 主 进程 输出 进程 号 及 子 进程 号 。 

3. 编写 一 个 程序 ,在 主 进 程 中 分 别 创建 两 个 子 进程 ,其 中 一 个 为 僵尸 进程 , 男 一 个 为 
孤儿 进程 。 

4. 编写 一 个 程序 ,在 主 进程 中 创建 一 个 子 进程 , 主 进程 接收 子 进程 的 结束 状态 ,并 输 
出 子 进程 的 结束 状态 。 

5. 编写 一 个 程序 ,调用 eXec 族 函 数 打 开 所 使 用 系统 中 的 网 络 浏览 器 。 

6. 仿照 第 4 章 中 守护 进程 的 示例 程序 ,编写 一 个 守护 进程 ,将 进程 的 pid、 时 间 等 信 
息 写 人 “/home/daemon. sys", 

7. 使 用 第 4 章 所 学 的 系统 调用 ,编程 实现 一 个 简单 的 Shell 程序 (分 别 使 用 system 
和 eXec 来 实现 ) 。 


实验 5 重 定向 和 管道 编程 


重 定向 和 管道 是 Linux 系统 中 Shell 环境 下 编程 和 灵活 使 用 命令 的 有 力 支持 。 重 定 
向 是 通过 修改 与 标准 1/0 文件 描述 符 相 关联 的 文件 ,使 进程 的 输入 、 输 出 或 错误 信息 与 
指定 的 文件 相 联系 。 管 道 是 指 用 于 连接 一 个 读 进 程 和 一 个 写 进程 ,以 实现 它们 之 间 通 信 
的 共享 文件 ,管道 分 为 匿名 管道 和 命名 管道 两 种 ,都 可 以 实现 进程 间 的 通信 。 
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一 、 实 验 目的 

1. 掌握 Shell 环境 下 使 用 重 定向 命令 和 管道 命令 。 

2. 掌握 实现 重 定向 的 三 种 方法 。 

3. 人 掌握 使 用 匿名 管道 实现 进程 间 通 信 的 方法 。 

A. 掌握 使 用 命名 管道 实现 进程 间 通 信 的 方法 。 

二 、 实 验 内 容 

1. 在 Shell 环境 中 练习 重 定向 命令 ,掌握 输入 重 定向 、 输 出 重 定向 和 错误 重 定向 的 实 
现 方法 。 

2. 在 Shell 环境 中 练习 使 用 管道 命令 ,能 分 辨 管道 命令 符号 前 后 两 条 命令 的 读 写 
角色 。 

3. 编写 一 个 程序 ,实现 ls -1 二 这 list. txt 命令 。 

4. 编写 一 个 程序 ,在 主 进程 中 创建 一 个 子 进程 ,使 用 匿名 管道 实现 主 进程 发 送 消息 
Hb. 

5. 编写 一 个 程序 ,在 主 进程 中 创建 一 个 子 进程 ,使 用 命名 管道 实现 主 进程 发 送 消息 
给 子 进程 。 

6. 编写 一 个 程序 ,使 两 个 无 亲缘 关系 的 进程 可 以 实现 简单 的 聊天 功能 。 

7. 在 实验 4 中 第 7 题 的 基础 上 ,为 简单 Shell 程序 添加 重 定向 功能 和 管道 功能 。 


实验 6 信号 安装 及 处 理 方式 


信号 是 Linux 系统 之 中 一 种 重要 的 通信 机 制 ,是 唯一 一 种 异步 通信 机 制 。Linux 系 
统 中 的 信号 机 制 在 UNIX 系统 信号 机 制 的 基础 上 做 出 了 扩充 ,因此 信号 分 为 可 靠 信号 和 
不 可 靠 信号 。 

—, 实验 目的 

1. 牢记 常用 的 几 种 信号 ,如 SIGINT、SIGQUIT、SIGCHLD 等 。 

2. 掌握 kill 命令 的 使 用 方法 。 

3. 掌握 信号 的 三 种 处 理 策略 。 

4. 掌握 signal 函数 和 sigaction 函数 的 使 用 方法 。 

5. 掌握 kill, raise,alarm 和 pause 函数 的 使 用 方法 。 

二 、 实验 内 容 

1. 在 Shell 环境 下 分 别 以 前 台 和 后 台 方式 运行 一 个 可 执行 程序 ,输入 Ctrl 十 c 和 Ctrl 
十 / ,观察 两 者 的 运行 结果 。 

2. 编写 程序 ,使 用 signal 函数 分 别 实现 对 信号 SIGINT 的 三 种 处 理 策略 。 

3. 编写 一 个 程序 ,使 用 sigaction 函数 分 别 实现 对 信号 SIGINT 的 三 种 处 理 策略 ,并 


尝试 输出 产生 信号 的 原因 。 
4. 编写 一 个 程序 ,使 用 alarm 函数 实现 计时 器 的 功能 ,每 秒 显示 出 当前 剩余 的 
时 间 。 


5. 编写 一 个 程序 ,在 主 进程 中 创建 一 个 子 进程 ,随后 主 进程 中 使 用 kill 函数 向 子 进 
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程 发 送 一 个 SIGINT 信号 , 子 进程 接收 到 信号 后 ,执行 sl 命令 (如 果 没 有 sl 命令 ,可 在 
Shell 环境 下 输入 sudo apt-get install sl 进行 安装 ) 。 
6. 编写 一 个 程序 ,使 用 alarm 和 pause 函数 ,实现 sleep 函数 的 功能 。 


实验 7 System V IPC 进程 通信 


System V IPC 是 贝尔 实验 室 对 UNIX 操作 系统 早期 的 进程 间 通信 手段 进行 了 系统 
的 改进 和 扩充 后 形成 的 ,包括 消息 队列 、 共 享 内 存 和 信和 号 量 三 种 机 制 ,使 用 这 三 种 IPC 的 
通信 进程 局 限 在 单 台 计算 机 内 。 消 息 队 列 是 在 内 核 空间 中 的 消息 链 队 列 ; 共 享 内 存 使 得 
多 个 进程 可 以 访问 同一 块 内 存 空间 ,是 最 快 的 可 用 IPC 形式 ,适合 传输 大 量 的 数据 。 信 
号 量 往往 作为 其 他 通信 机 制 的 辅助 手段 ,来 达到 进程 间 的 同步 及 互 斥 。 

一 、 实 验 目的 

1. 掌握 Shell 环境 下 IPC 相关 的 常用 命令 ,如 ipes ,ipcmk \ipcrm 等 。 

2. 掌握 消息 队列 .共享 内 存 和 信号 量 使 用 的 场合 。 

3. 掌握 使 用 消息 队列 实现 进程 间 通 信 的 方法 。 

A. 掌握 使 用 共享 内 存 实现 进程 间 通 信 的 方法 。 

5. 掌握 使 用 信号 量 辅助 其 他 通信 机 制 的 方法 。 

6. 掌握 IPC 资源 键 的 生成 方法 。 

二 、 实 验 内 容 

l. 编写 一 个 程序 ,使 用 消息 队列 实现 聊天 室 的 功能 。 

2. 编写 一 个 程序 ,使 父子 进程 通过 共享 内 存 实现 数据 共享 。 

3. 在 第 7 章 中 使 用 文件 实现 进程 间 通 信 的 示例 程序 基础 上 ,增加 信号 量 来 协调 服务 
器 /客户 端 进程 的 互 斥 。 

4. 以 当前 目录 和 数字 126—128 为 参数 ,使 用 ftok 函数 生成 三 个 键 值 ,并 用 该 键 值 创 
建 消息 队列 .共享 内 存 、 信 号 量 集合 各 一 个 ,随后 使 用 system 函数 或 在 Shell 环境 下 使 用 
命令 ipes 观察 三 个 IPC 资源 的 属性 。 


实验 8 线程 管理 


一 、 实 验 目 的 
. 掌握 Linux 下 线程 程序 编译 的 过 程 。 
. 掌握 Linux 中 创建 线程 的 方法 。 
. 掌握 Linux 中 线程 基本 操作 和 系统 调用 的 使 用 。 
. 掌握 多 线程 编程 的 基本 方法 。 
二 、 实 验 内 容 
1. 编程 实现 ,创建 一 个 线程 , 子 线程 循环 10 次 ,接着 主线 程 循环 100 次 ; 子 线程 再 循 
环 10 次 , 接 主 线程 又 循环 100 次 ;如 此 反复 循环 50 次。 
2. 创建 两 个 子 线程 : 一 个 子 线程 (生产 者 线程 ) 依 次 向 缓冲 区 写 人 整数 0,1,2,…， 
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19; 另 一 个 子 线程 (消费 者 线程 ) 暂 停 3s 后 ,从 缓冲 区 读数 ,每 次 读 一 个 ,并 将 读 出 的 数字 
从 缓冲 区 删除 ,然后 将 数字 显示 出 来 ; 父 线程 等 待 子 线程 2( 消 费 者 线程 ) 的 退出 信息 , 待 
收集 到 该 信息 后 , 父 线程 就 返回 。 

3. 编写 一 个 程序 ,创建 3 个 线程 ,假设 这 3 个 线程 的 ID 分 别 为 A、B、C, 每 个 线程 将 
自己 的 ID 在 屏幕 上 打印 10 遍 , 要 求 输出 结果 必须 按 ABC 的 顺序 显示 ,如 ABCABC…… 


实验 9 线程 间 通 信 


一 、 实 验 目的 
. 理解 线程 同步 机 制 。 
. 掌握 使 用 互 斥 锁 实现 线程 间 的 同步 的 方法 。 
.掌握 使 用 条 件 变 量 实现 线程 间 的 同步 的 方法 。 
.掌握 使 用 读 写 锁 实现 线程 间 的 同步 的 方法 。 
. 掌握 使 用 信号 实现 线程 间 的 同步 的 方法 。 
Z, 实验 内 容 
1. 将 一 个 文件 中 的 内 容 写 入 到 另 一 个 空白 文件 中 ( 读 与 写 的 操作 分 别 在 两 个 线程 中 
完成 传送 数据 使 用 共享 内 存 实现 ) ,要 求 文件 内 容 的 大 小 要 远大 于 所 用 共享 内 存 的 大 小 。 
2. 在 主线 程 中 接受 键盘 输入 ,并 把 输入 字符 放 人 缓冲 区 中 ,在 缓冲 区 满 后 ,由 另 一 个 
线程 输出 缓冲 区 的 内 容 , 用 互 斥 锁 实现 线程 间 的 同步 。 
3. 编写 一 个 包含 2 个 线程 的 程序 ,在 主线 程 中 创建 一 个 全 局 变量 并 初始 化 为 0, 在 另 
一 个 线程 中 对 这 个 全 局 变量 进行 累加 运算 ,并 在 结束 时 向 主线 程 返回 一 个 结果 ,在 主线 程 
中 打印 输出 。 
A. 编写 两 个 线程 ,其 中 一 个 线程 接收 用 户 输入 ,一 个 线程 输出 用 户 输入 的 数据 ,使 用 
线程 同步 方法 进行 处 理 , 不 采用 类 似 sleep(x) 的 等 待 语句 。 
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一 、 实 验 目 的 
. 理解 TCP/IP 协议 基本 原理 。 
. 掌握 Linux 下 套 接 字 编程 的 基本 方法 。 
. 掌握 基于 TCP 的 网 络 通信 方法 。 
. 掌握 基于 UDP 的 网 络 通信 方法 。 
. 掌握 Linux 中 字 节 处 理 函 数 的 使 用 方法 。 
二 、 实 验 内 容 
1. 使 用 套 接 字 通 信 方 式 实现 : 从 客户 端 发 送 一 条 消息 后 ,服务 端 接收 这 条 消息 ,并 
在 服务 端 显示 (recv msg from 客户 端 : xxxx) 。 
2. 编写 基于 TCP 协议 网 络 聊天 程序 ,要 求 发 送 程序 和 接收 程序 能 够 接收 键盘 输入 
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并 彼此 之 间 相 互 发 送 数据 。 
3. 编写 基于 UDP 协议 网 络 聊天 程序 ,要 求 发 送 程序 和 接收 程序 能 够 接收 键盘 输入 
并 彼此 之 间 相 互 发 送 数据 。 


4. 编写 一 个 以 客户 机 /服务 器 模式 工作 的 程序 ,要 求 在 客户 端 读 取 系统 文件 /etd/ 
passwd 的 内 容 , 传 送 到 服务 器 ,服务 器 接收 字符 串 ,并 在 显示 器 显示 出 来 。 


